情感分析是一种自动过程,它使用AI从文本中识别正面,负面和中立的观点。被广泛用于从社交媒体评论,调查回复和产品评论中获取见解,并做出以数据为依据的决策。
在当今每天产生2.5兆字节数据的世界中,情感分析已成为理解这些数据的关键工具。
但是……它是如何工作的?
有哪些不同的方法?它的警告和局限性是什么?您如何在业务中使用情感分析?
在下面,您将找到这些问题的答案以及有关情感分析所需的所有知识。无论您是经验丰富的数据科学家,开发人员,营销人员,产品分析师,还是刚开始进行文本分析的人,本综合指南均适合您。
通过阅读本指南,你可以添加本文到书签以备查看,也可以点击链接跳转到您感兴趣的部分。本指南分为四个部分:
- 情感分析基础
- 什么是情绪分析?
- 范围
- 种类
- 为什么情感分析很重要?
- 情绪分析如何工作?
- 演算法
- 挑战性
- 情绪分析的准确性如何?
- 用例和应用
- 社交媒体监控
- 品牌监控
- 客户的反馈意见
- 客户服务
- 市场调查
- 资源资源
- 从哪儿开始?
- 在线演示
- 讲解
- 研究文献
- 数据集
- 工具和API
让我们开始吧!
情感分析基础
什么是情感分析?
情感分析是分析文本数据并将观点分为负面,正面或中立的自动化过程。通常,除了识别意见之外,这些系统还会提取表达式的属性,例如:
- 极性:如果说话者表达正面或负面的意见,
- 主题:正在谈论的事情,
- 意见持有人:表达意见的人或实体。
当前,情感分析由于其许多实际应用而引起了极大的兴趣和发展。公司使用情感分析来自动分析调查回复,产品评论,社交媒体评论等,以获取有关其品牌,产品和服务的宝贵见解。
例如,我们的一位客户使用情绪分析来自动分析4,000多个评论,并更好地了解他们的客户如何看待他们的产品。他们发现,客户普遍感到高兴的pricing
,但抱怨一个很多关于他们customer service
:
情感分析范围
情感分析可以应用于不同的范围级别:
- 文档级 情感分析可获取完整文档或段落的情感。
- 语句级别的 情感分析获得单个语句的情感。
- 子语句级 情感分析获得子句子中子表达的情感,即言外之意,寓意等。
情感分析的类型
情感分析的类型和风格多种多样,从注重极性(积极,消极,中立)的系统到检测感觉和情感(生气,快乐,悲伤等)或识别意图(例如感兴趣的 。不感兴趣)。在以下部分中,我们将介绍最重要的部分。
细粒度的情感分析
有时,您可能还希望更精确地了解意见的极性,因此,您可以考虑以下类别,而不是仅仅谈论正面,中立或负面意见:
- 非常积极
- 正
- 中性
- 负
- 很负面
这通常被称为细粒度的情绪分析。例如,可以将其映射到评论中的5星级,例如:非常正面= 5星,非常负面= 1星。
一些系统还通过识别积极或消极情绪是否与特定感觉相关联来提供不同的极性,例如,愤怒,悲伤或忧虑(即消极感觉)或幸福,爱或热情(即积极感觉)。
情绪检测
情绪检测旨在检测诸如幸福,沮丧,愤怒,悲伤等情绪。许多情感检测系统都采用词典(即单词列表及其传达的情感)或复杂的机器学习算法。
诉诸词典的缺点之一是人们表达情感的方式千差万别,他们使用的词汇项目也是如此。有些通常会表达愤怒的词,例如狗屎 或杀死(例如,在您的产品中是狗屎 或您的客户支持正在折磨我),也可能表示幸福(例如,在诸如“ 这是狗屎或您正在杀死它”之类的文字中)。
基于方面的情感分析
通常,在分析主题(例如产品)时,您可能不仅会对人们谈论产品的正面,中立或负面态度感兴趣,而且还会对人们谈论产品的哪些特定方面或特征感兴趣。这就是基于方面的情感分析。在我们之前的示例中:
“此相机的电池寿命太短。”
这句话表达了对相机的负面评价,但更确切地说,是对电池寿命的负面评价,这是相机的一个特殊功能。
意图分析
目的分析基本上可以检测人们想对文本做什么,而不是人们对文本说什么。看下面的例子:
“您的客户支持太差劲了。老子等了20分钟”。
“我想知道如何更换墨盒”。
“您能帮我填写这张表格吗?”
人类在检测第一文本中的投诉,第二文本中的问题和第三文本中的请求时没有问题。但是,机器可能会遇到一些难以识别的问题。有时,可以从文本中推断出预期的操作,但是有时,推断它需要一些上下文知识。
多语言情感分析
多语言情感分析可能是一项艰巨的任务。通常,需要大量预处理,并且该预处理需要使用大量资源。这些资源中的大多数都可以在线获得(例如,情感词典),但是必须创建许多其他资源(例如,翻译的语料库或噪声检测算法)。使用可用资源需要大量的编码经验,并且可能需要很长时间才能实现。
替代方法是自动检测文本中的语言,然后为您选择的语言训练一个自定义模型(如果文本不是用英语编写的),最后执行分析。
为什么情绪分析很重要?
据估计,全球80%的数据都是非结构化的,并且没有以预定的方式进行组织。其中大部分来自文本数据,例如电子邮件,支持通知单,聊天,社交媒体,调查,文章和文档。这些文本通常难以分析,费时且昂贵,难以分析,理解和整理。
情绪分析系统使公司可以通过自动化业务流程,获得可行的见解并节省手动数据处理时间(换句话说,通过提高团队效率)来理解这些非结构化文本。
情绪分析的一些优点包括:
- 可扩展性:
您能否想象通过数千条推文,客户支持对话或客户评论进行手动排序?数据太多,无法手动处理。情感分析允许以有效和具有成本效益的方式大规模处理数据。
- 实时分析:
我们可以使用情绪分析来识别关键信息,以便在特定情况下实时了解情况。社交媒体中是否会爆发公关危机?生气的客户即将流失?情绪分析系统可以帮助您立即识别此类情况并采取行动。
- 符合标准:
人类没有遵循清晰的标准来评估一段文字的情感。据估计,在判断特定文本的情感时,不同的人只会同意约60-65%的时间。这是一项主观任务,受个人经验,思想和信念的影响很大。通过使用集中式情感分析系统,公司可以将相同的标准应用于所有数据。这有助于减少错误并提高数据一致性。
情绪分析如何工作?
情感分析算法
有许多方法和算法可以实现情感分析系统,可以分为以下几种:
- 基于规则的系统,基于一组手工制定的规则执行情感分析。
- 依靠机器学习技术从数据中学习的自动系统。
- 结合了基于规则和自动方法的混合系统。
基于规则的方法
通常,基于规则的方法用某种脚本语言定义了一组规则,这些规则标识主观性,极性或观点的主题。
规则可以使用各种输入,例如:
- 经典的NLP技术,例如词干,标记化,语音标记和解析的一部分。
- 其他资源,例如词典(即单词和表达列表)。
基于规则的实现的一个基本示例如下:
- 定义的极化话两个列表(如否定词,如糟糕,最糟糕的,丑等,并积极的词语,如良好的,最好的,美丽的,等等)。
- 给定一个文本:
- 计算出现在文本中的肯定词的数量。
- 计算出现在文本中的否定词的数量。
- 如果肯定的单词出现次数大于否定的单词出现次数,则返回肯定的情绪,反之,则返回否定的情绪。否则,返回中性。
该系统非常幼稚,因为它没有考虑单词在序列中的组合方式。可以进行更高级的处理,但是这些系统很快变得非常复杂。它们可能很难维护,因为可能需要新规则来增加对新表达和词汇的支持。此外,由于与先前规则的交互作用,添加新规则可能会产生不良结果。结果,这些系统需要在手动调整和维护规则上进行大量投资。
自动途径
与基于规则的系统相反,自动方法不依赖于手工制定的规则,而是依赖于机器学习技术。情感分析任务通常被建模为分类问题,其中向分类器提供文本并返回相应的类别,例如正,负或中性(如果正在执行极性分析)。
所述机器学习分类器通常可以通过以下步骤和组件来实现:
训练和预测过程
在训练过程(a)中,我们的模型基于用于训练的测试样本学习将特定的输入(即文本)与相应的输出(标签)相关联。特征提取器将输入的文本转换为特征向量。成对的特征向量和标记(例如正,负或中性)被输入到机器学习算法中以生成模型。
在预测过程(b)中,特征提取器用于将看不见的文本输入转换为特征向量。然后将这些特征向量输入模型,该模型会生成预测的标签(再次,正,负或中性)。
从文本中提取特征
机器学习文本分类器的第一步是将文本转换为数字表示形式,通常是矢量。通常,向量的每个分量代表预定义词典(例如,极化单词的词典)中单词或表达式的频率。此过程称为特征提取或文本矢量化,并且经典方法是带有单词袋(bag-of-words)或单词泛化(bag-of-ngrams)的频率。
This answer assumes that you know what an n-gram is.
You can think of a bag of n-grams as being equivalent to a bag of words, where the “words” are n-grams instead of unigrams.
Consider the sentence, “my name is alvin”.
Bag of words features: {my, name, is, alvin}.
Bag of (word) bigrams features: {<s>_my, my_name, name_is, is_alvin, alvin_</s>}.
N-grams are generalization of set of words(BOW) because they mind the words order. Skip-N-grams even bigger generalization, but they are difficult to handle – they are too many.
To find the structural difference follow the Wikipedia, to find reason to apply think first.
https://www.quora.com/What-is-the-difference-between-bag-of-words-and-bag-of-n-grams
最近,已经基于词嵌入(也称为词向量)应用了新的特征提取技术。这种表示形式使具有相似含义的单词具有相似的表示形式,从而可以提高分类器的性能。
分类算法
分类步骤通常涉及诸如朴素贝叶斯,逻辑回归,支持向量机或神经网络之类的统计模型:
- 朴素贝叶斯(NaïveBayes):一系列概率算法,使用贝叶斯定理预测文本的类别。
- 线性回归:统计中非常著名的算法,用于在给定一组特征(X)的情况下预测某些值(Y)。
- 支持向量机(Support Vector Machines):一种非概率模型,使用文本示例的表示形式作为多维空间中的点。映射这些示例,以便不同类别(情感)的示例属于该空间的不同区域。然后,将新文本映射到同一空间,并根据它们属于哪个区域来预测属于一个类别。
- 深度学习:一组多样的算法,试图通过使用人工神经网络来处理数据来模仿人脑的工作方式。
情绪分析指标与评估
您可以通过多种方式获得性能指标,以评估分类器并了解情感分析模型的准确性。最常用的一种就是交叉验证。
交叉验证的作用是将训练数据分成一定数量的训练褶皱(占训练数据的75%)和相同数量的测试褶皱(占训练数据的25%),使用训练褶皱进行训练分类器,并针对测试折叠进行测试以获取效果指标(请参见下文)。该过程重复多次,并计算每个指标的平均值。
如果你的测试集始终是相同的,你可能会过度拟合到测试集,这意味着你可能会调整你的分析给定数据集的这么多,你可能无法分析一组不同的。交叉验证有助于防止这种情况。您拥有的数据越多,使用的折页就越多。
精度,召回率和准确性
精度,召回率和准确性是用于评估分类器性能的标准指标。
精度测量在被(正确和错误地)预测为属于该类别的所有文本中,有多少文本被正确预测为属于给定类别。
召回率测量应在应被预测为属于该类别的所有文本中,有多少文本被正确预测为属于给定类别。我们也知道,我们向分类器提供的数据越多,召回率就越高。
准确性衡量的是在语料库中所有文本中正确预测了多少文本(属于一个类别而不属于该类别)。
多数情况下,精度和召回率用于衡量性能,因为仅凭精度并不能说出分类器的优劣。
对于诸如情感分析之类的艰巨任务,准确度和召回率一开始可能很低。当您为分类器提供更多数据时,性能将会提高。但是,正如我们将在下面看到的那样,由于带注释的数据不太可能是准确的,因此精度级别可能不会太高。但是,如果您向分类器提供一致标记的数据,则结果将与其他任何分类问题的结果一样好。
注释者间协议
当涉及批注者之间的协议(即人类就给定批注任务达成协议)时,最常用的指标之一是Krippendorff的Alpha。据赛义夫等。,用于Twitter情感分析的最佳注释者间协议达到Krippendorff的Alpha值为0.655。这意味着有很多协议(因为alpha大于零),但是我们认为它还差得远(例如:0.8左右,这是社会科学家用来表示数据可靠的最低可靠性阈值,请参见在这里)。这就是说,只能从上面引用的论文中描述的注释任务的结果得出有关推文情感的初步结论。
总而言之,这个0.655也是人类情感分析检测难度的指标。考虑到机器从它们所获取的数据中学习,自动预测可能会反映出嵌入在数据中的人类分歧。
混合方法
混合方法的概念非常直观:只需结合基于规则和自动两个方面的优点即可。通常,通过组合两种方法,这些方法可以提高准确性和精度。
情绪分析挑战
近年来,情感分析中的大多数工作都是围绕处理该领域的一些主要挑战和局限性,开发出更准确的情感分类器。
主观性与语气
主观和客观文本的检测与分析语气一样重要。实际上,所谓的客观文本并不包含明显的情感。举例来说,您打算分析以下两个文本的情绪:
包装很好。
包装是红色的。
大多数人会说,情绪对第一个是积极的,对第二个是中立的,对吗?对于所有谓词(形容词,动词和某些名词)在产生情感上的方式,都不应一视同仁。在上面的示例中,nice比red更主观。
背景和极性
所有话语都是在某个时间点,某个地方,由某个人或某些人说出的。所有话语都是在上下文中说出的。在没有上下文的情况下分析情绪变得非常困难。但是,如果没有明确提及,机器将无法了解上下文。由上下文引起的问题之一是极性的改变。查看对调查的以下答复:
一切。
绝对没有!
想象一下,上面的回答来自对问题的回答。第一个反应是肯定的,第二个反应是否定的,对吗?现在,想象一下响应来自问题的答案,您对此事件不满意吗?问题中的否定将使情感分析彻底改变。
如果我们要至少考虑文本生成的上下文,则需要大量的预处理或后处理。但是,如何预处理或后处理数据以捕获有助于分析情绪的上下文位点并不是一件容易的事。
反讽与讽刺
字面意思和预期意义(即讽刺)之间的差异通常与反义词(即讽刺)的侮辱性或嘲讽性一样,将积极情绪变为消极情绪,而消极情绪或中性情绪可能变为积极情绪。但是,检测讽刺或嘲讽需要对文本产生的上下文进行大量分析,因此,很难自动检测出来。
例如,查看对该问题的一些可能答案,您是否对我们有很好的客户体验?下面。
是的 当然。
不是一个,而是很多!
您对上述回应有何看法?可能您已经听过第一个回复很多次了,您会说否定的,对吧?问题在于没有文字提示会使机器了解负面情绪,因为是的,而且肯定是正面的或中立的。
第二个回应如何?在这种情况下,情绪是积极的,但是我们确定您可以提出许多不同的情境,其中相同的响应可以表达消极的情绪。
比较
在情感分析中如何对待比较是另一个值得解决的挑战。看下面的文字:
该产品首屈一指。
这比旧工具要好。
总比没有好。
有一些比较,例如上面的第一个比较,不需要任何上下文线索即可正确分类。
不过,第二和第三本书的分类难度更高。您会将它们归类为中立还是肯定?可能您更可能为第二个选择正数,为第三个选择中性,对吗?同样,上下文可以有所作为。例如,如果第二文本谈论的旧工具在上下文中被认为是无用的,那么第二文本将与第三文本非常相似。但是,如果未提供上下文,则这些文本会有所不同。
表情符号
根据Guibon等人的说法,有两种表情符号。。西方表情符号(例如:D)仅以一个字符或几个字符的组合进行编码,而东方表情符号(例如\\((ツ)_ /))是垂直字符的较长组合。表情符号在文字情感中尤其重要,尤其是在推文中。
对推文执行的情感分析需要特别注意字符级别和单词级别。但是,无论您对它们中的每一个付出了多大的关注,都可能需要大量的预处理。例如,您可能需要预处理社交媒体内容,并将西方和东方表情符号都转换为令牌并将其列入白名单(即,始终将它们用作分类目的),以帮助提高情感分析性能。
这是一个非常全面的表情符号及其unicode字符列表,在预处理时可能会派上用场。
定义中性
为了进行准确的情绪分析,定义中立意味着什么是另一个挑战。与所有分类问题一样,定义类别(在这种情况下为中性标签)是问题中最重要的部分之一。什么,你的意思是中性的,积极的,还是消极当你训练情绪分析模型事做。由于标记数据要求标记标准必须一致,因此必须对问题进行良好的定义。
以下是有关中性标签可能包含的一些想法:
- 目标文本。就像我们在这里所说的,所谓的客观文本不包含明显的情感,因此您应该将这些文本包括在中立类别中。
- 不相关的信息。如果您尚未预处理数据以过滤掉不相关的信息,则可以将其标记为中性。但是,要小心!仅当您知道这会影响整体性能时,才这样做。有时,您会为分类器添加噪音,并且性能可能会变差。
- 包含愿望的文字。像我希望产品具有更多集成的一些愿望通常是中立的。但是,包括比较在内的那些分类(如我希望产品更好)很难分类
情感分析的准确性如何?
情感分析是这样的:即使对于人类来说,这也是一项艰巨的任务。就是说,情绪分析分类器可能不如其他类型的分类器那么精确。请记住,注释者之间的协议非常低,并且机器从它们所获取的数据中学习(请参见上文)。
也就是说,您可能会说,值得付出努力吗?答案很简单:它确实值得!情绪分析预测有时可能是错误的,但是通过使用情绪分析,您将有大约70-80%的机会在提交文本进行分类时正确处理。
如果您或您的公司以前没有使用过情绪分析,那么您会很快看到一些改善。对于典型的用例,例如票务路由,品牌监控和VoC分析(请参见下文),这意味着您将节省大量的时间和金钱-您现在可能会在内部人工工作上进行投资,-您的团队有些沮丧,并提高了您(或公司)的生产力。
情绪分析用例和应用
在本部分中,我们将深入探讨现实生活中的用例,应用程序以及所有这些示例可能对企业,城市和社会产生的影响-如果需要,可以进行野外情绪分析。
具体来说,我们将在下面检查情绪分析的使用:
- 社交媒体监控
- 品牌监控
- 客户之声(VoC)
- 客户服务
- 市场调查
社交媒体监控
在2017年4月9日命运攸关的夜晚,联合航空强行将乘客从超额预定的航班上撤走。这场噩梦般的事件是由其他乘客在其智能手机上拍摄并立即发布的。其中一个发布到Facebook的视频被分享了超过87,000次,并在24小时后的星期一下午6点被观看了680万次。
公司的不屑一顾使惨败变得惨不忍睹。周一下午,他们在CEO的推特上发表了一条推文,对“必须重新容纳客户”表示歉意。引起公众愤怒–您可以想象在Twitter上的活动日。
这恰恰是我们所有人都希望没有的开心的PR灾难。这也是为什么我们要一个很好的例子,不仅是当人们都在谈论我们的品牌,但是怎么他们在谈论它。更多提到确实不相等的正提到。
在当今时代,各种形状和规模的品牌与客户,潜在客户甚至在诸如Facebook,Twitter和Instagram之类的社交网络上的竞争都有有意义的互动。大多数营销部门已经开始关注在线提及的内容 -随着更多的品牌知名度,他们的讨论越来越多。但是,如今,我们可以更进一步。通过在社交媒体上使用情感分析,我们可以洞悉品牌周围的对话质量。
情感分析如何使用
- 分析一段时间内的推文和/或Facebook帖子,以查看特定受众群体的情绪。
- 在提及您品牌的所有社交媒体上运行情绪分析,并根据紧急程度自动进行分类。
- 自动将社交媒体提及路由到最适合做出响应的团队成员。
- 自动化任何或所有这些过程。
- 使用分析来深入了解整个社交媒体渠道中正在发生的事情。
主要好处
情绪分析在社交媒体监视中很有用,因为它可以帮助您执行以下所有操作:
- 优先采取行动。哪一个更为紧急:发怒的客户或微妙的“谢谢!”喊叫?显然是热火。情绪分析使您可以通过阳性和阴性轻松过滤未读的提及,向您显示哪些熊熊大火被列入“立即扑灭”清单,哪些慢烟味者可以稍等片刻。
- 跟踪一段时间内的趋势。
- 调整到特定的时间点-即新产品发布的准备工作或特定的不良新闻发布的那天。
- 密切注意比赛。为什么不像监视自己的社交媒体一样监视竞争对手的社交媒体?如果密切关注,也许您会发现他们的新产品的特定功能受到了负面回应,而您则针对这一差距设计了潜在客户生成活动。他们甚至不知道是什么打击了他们。
例如:根据Twitter,特朗普vs克林顿
在2016年美国总统选举期间的几个月中,我们收集并分析了来自世界各地的用户发布的数百万条提及克林顿或特朗普的推文。我们对这些推文中的每条推文都以正面,中立或负面的情绪进行了分类。
例如:
- 负面:“种族不和谐是美国人构想,培养,完善和永恒的,包括@realDonaldTrump的父亲。变得真实!”
- 中立:“ @ HillaryClinton将在今晚的总统辩论中收到第一个问题,根据@CBSNews #ClintonVsTrump的说法”。
- 正面:“美国人信任@realDonaldTrump,使我们的经济再创辉煌!”
- 积极:“ @ wcve,我们的城市如何爱他,他真的爱我们的城市,这真是令人惊讶。@HillaryClinton是副总裁的绝佳选择。@timkaine”。
通过这种简单,容易的分析,我们发现了有趣的见解:
- @realDonaldTrump(约450k /天)比@HillaryClinton(约250k /天)提及的推文更多。同样,这并不等于积极,而是暗示着品牌知名度(在选举之类的情况下,知名度是关键)。
- 对于这两个候选人来说,负面消息多于正面消息。考虑到Twitter和政治因素,这不足为奇。
- 与克林顿相比,特朗普的正负推特比率更好。
综上所述,与推特有关克林顿的人相比,在推特上有更多的人在Twitter上发推文,在推特上发推特的人做得更加积极。
品牌监控
品牌不仅可以在社交媒体上获得大量信息,而且可以在互联网上更广泛地查看人们在网上如何谈论它们。我们可以将注意力集中在新闻,博客和论坛等地方,而不是只关注特定的社交媒体平台(例如Facebook和Twitter),而且不仅要关注提及的数量,而且还要关注提及的质量。
例如,在我们的联合航空(United Airlines)示例中,爆发事件是在少数乘客的社交媒体平台上开始的。数小时之内,新闻网站就将其拾取,并像野火一样在美国蔓延。消息随后传到中国和越南,据报道该乘客是华裔越南裔美国人,人们指责种族歧视者。在中国,该事件成为微博上的第一大热门话题,微博是一个拥有近5亿用户的微博网站。
再者,这一切都是在事件发生后的几个小时和几天之内发生的。
情感分析如何使用
- 在一段时间内分析新闻文章,博客文章,论坛讨论和互联网上的其他文本,以查看特定受众群体的情绪。
- 通过情感分析,自动将所有在线提及内容的紧迫性归类到您的品牌。
- 自动提醒指定团队成员有关其工作领域的在线提及。
- 自动化任何或所有这些过程。
- 通过获取各种有趣的见解和分析,更好地了解品牌的在线形象。
主要好处
情绪分析在品牌监控中很有用,因为它可以帮助您完成所有这些操作:
- 了解您的品牌声誉如何随着时间演变。
- 研究您的竞争并了解他们的声誉如何随着时间而演变。
- 确定潜在的公关危机,并知道立即采取行动。再次,确定需要立即扑灭什么火灾以及提及哪些内容可以等待。
- 调整到特定的时间点。同样,也许您只想在IPO提交当天或新产品发布时提及新闻。情绪分析使您可以做到这一点。
示例:加拿大Expedia
在圣诞节前后,Expedia Canada开展了一次经典的“越冬”营销活动。除了选择小提琴作为背景音乐外,其他一切都还不错。可以理解,人们进入了社交媒体,博客和论坛。Expedia注意到了这一点,并删除了广告。然后,他们制作了一系列后续衍生视频:一个视频显示了原始演员砸小提琴,另一个视频中,他们邀请了一个在Twitter上抱怨的真正的追随者走进来,将小提琴撕了下来。尽管他们的原始产品远非完美无缺,但他们能够通过将真实的客户反馈纳入持续的迭代中来赎回自己。
使用情感分析(和机器学习),您可以自动监视品牌周围的所有chat不休,并在有足够时间对其进行消散的同时检测这种潜在爆炸性的情况。
客户的反馈意见
社交媒体和品牌监控为我们提供了有关客户情绪的即时,未经过滤的,宝贵的信息。与此同时,还有另外两个洞察力–调查和客户支持互动。团队通常会查看其净促销员分数(NPS),但我们也可以将此分析应用于产生文本客户反馈的任何类型的调查或沟通渠道。
NPS调查提出了一些简单的问题–即,您会向朋友或家人推荐该公司,产品和/或服务吗?和为什么?–并以此将客户识别为推动者,消极者或贬低者。目标是确定总体客户体验,并找到将所有客户提升到“促销”级别的方法,从理论上讲,他们将购买更多,停留更长的时间并推荐其他客户。
数值调查数据易于汇总和评估,但我们也希望“为什么”答案也能轻松实现。常规的NPS分数仅会为您提供一个数字,而没有其他含义,以及分数为何落在此处。情感分析使这一步更进一步。
如何使用情感分析:
- 分析汇总的NPS或其他调查答复。
- 分析汇总的客户支持互动。
- 随时间推移跟踪有关业务特定方面的客户情绪。这增加了深度,以解释为什么总体NPS得分可能会发生变化,或者特定方面是否已独立发生变化。
- 定位个人以改善服务。通过自动对收到的调查进行情绪分析,可以提醒您那些对您的产品或服务有强烈消极情绪的客户,他们可以专门处理这些问题。
- 确定特定的客户群是否对您的公司更有信心。您可以根据特定的受众特征,兴趣爱好,人物角色等将情绪归零。
主要好处:
情绪分析有助于理解客户的声音(VoC),因为它可以帮助您执行以下所有操作:
- 使用情感分析的结果来设计更明智的问题,以便将来进行调查。
- 了解随着时间推移客户体验的细微差别,以及为什么以及如何发生变化。
- 通过按部门和业务的特定方面为客户提供更深入的客户体验视图,从而使您的内部团队获得授权。
- 更快地响应客户的信号和转变。
示例:麦肯锡城市之声项目
在巴西,从2007年到2015年,联邦公共支出增长了156%,而人们对公共服务的满意度稳步下降。对这种适得其反的进展感到不满,城市规划部招募了麦肯锡公司来帮助他们开展一系列新项目,这些新项目首先将重点放在提供服务时的用户体验或公民出行上。这种以公民为中心的治理方式导致了所谓的智慧城市的兴起。
麦肯锡开发了一种名为“城市之声”的工具,该工具可对150多种不同指标进行公民(客户)调查,然后运行情绪分析,以帮助领导者了解选民的生活和需求,以便更好地为公共政策提供信息。通过使用此工具,巴西政府得以解决紧急需求(例如,更安全的公交系统)并首先对其进行了改进。
如果甚至以繁文tape节和缓慢的节奏而闻名的整个城市和国家都将客户旅程和情感分析纳入其决策过程,那么创新型公司最好遥遥领先。
客户服务
我们都知道演练:一流的客户体验=更可能的回头客。尤其是在最近几年,围绕客户体验和客户旅程进行了很多讨论(理应如此)。公司领导已经开始认识到,往往是如何他们提供是一样(如果不是更多)重要的,因为什么他们提供。如今,客户比以往任何时候都希望他们在公司中的体验是即时,直观,个性化和轻松的。实际上,研究表明,仅经过一次负面互动,就有25%的客户会转换为竞争对手。
我们已经研究了如何使用情感分析来研究更广泛的VoC,但是现在我们将拨入专门的客户服务团队。
如何使用情感分析:
- 自动化系统以对所有传入的客户支持查询运行情感分析。
- 快速发现心怀不满的客户,并将这些门票显示在顶部。
- 将查询路由到最适合响应的特定团队成员。
- 使用分析可以深入了解整个客户支持部门正在发生的事情。
主要好处
情绪分析在客户支持中很有用,因为它可以帮助您完成所有这些操作:
- 优先安排响应票证的顺序,请确保首先解决最紧急的需求。
- 通过自动将票证分配给特定类别或团队成员来提高效率。
示例:在Twitter上分析客户支持互动
只是为了踢球,我们决定对美国四大电话运营商(AT&T,Verizon,Sprint和T-Mobile)如何处理Twitter上的客户支持互动进行一些分析。我们下载了数以千计的提及公司的推文(按名称或按名称),并通过MonkeyLearn情感模型运行它们,以将每条推文归类为肯定,中性或否定。然后,我们使用了新的Insight Extractor,它将所有文本作为一个单元读取,提取最相关的关键字,并返回最相关的句子,包括每个关键字。
这里有一些见解:
- T-Mobile的正面推文比例远远超过了其他地方。
- Verizon是唯一一家负面消息多于正面消息的公司。
- Verizon上积极推文的热门关键字包括诸如“新电话”,“感谢”和“优质的客户服务”之类的典型术语。关键句子是团队与关注者之间典型,正式,有些枯燥的互动。
- T-Mobile上正面推文的热门关键字包括其客户支持团队中的人员姓名,因为他们的团队具有更高的参与度,可以与来访者进行任何类型的对话。
综上所述,这可能意味着社交媒体上更具个性化,更具吸引力的方式会引起更多积极的回应和更高的客户满意度。
市场调查
作为最终用例,情感分析可支持各种市场研究和竞争分析。无论您是在开发新市场,预测未来趋势还是在竞争中保持优势,情绪分析都可以使一切变得不同。
如何使用情感分析:
- 分析您品牌的产品评论,并将其与竞争对手进行比较
- 生成每周,每月或每日报告–一种预警系统
- 比较国际市场的观点
- 分析正式的市场报告或商业期刊,以获得长期,广泛的趋势
- 分析推文和社交媒体帖子中的实时事件
- 分析评论以获取未过滤的客户反馈
- 使用基于方面的情感分析来深入了解细节以及市场趋势不透明的原因
主要好处
情绪分析在市场研究和分析中很有用,因为它可以帮助您:
- 挖掘新的信息来源。
- 量化其他定性信息。
- 在已收集的定量见解中添加定性维度。
- 实时提供信息,而无需回顾。
- 自动执行定期(也许每周)报告。
- 例如,在新兴市场中,缺少公共数据的地方。
范例:TripAdvisor的饭店评论
我们的团队对人们对世界上几个主要城市的酒店的感觉感到很好奇,因此我们抓取并分析了TripAdvisor的超过一百万条评论。我们查看了伦敦,巴黎,纽约,曼谷,马德里,北京和里约热内卢的酒店。
这里有一些见解:
- 评论大部分是正面的-平均而言,人们撰写的文章中有82%被正面评价:
- 伦敦酒店获得最差评价。
- 伦敦被认为比纽约更肮脏,且整体食物最糟糕。
我们使用了关键字提取模块来分析肯定/否定评论的实际内容,并发现了一些更有趣的见解:
- “蟑螂”仅在曼谷出现–注意!
- “牛角面包”仅出现在巴黎(正如我们所期望的)。不过,令人震惊的是,它们似乎令人失望-几乎完全在负面环境中进行了审查。经过更深入的潜水,我们发现这更多地反映了酒店早餐食品的劣势,而不是城市本身(phe!)。
情感分析资源
从哪里开始情感分析
假设您最近听说了情绪分析,听起来像是魔术:自动了解特定消息对某件事的好坏。您会想到此技术的不同应用而受到启发。
现在,您想更多地了解情绪分析,更深入地探讨您可能拥有的不同想法。但是,问题是您真的不知道从哪里开始或下一步要做什么。
情绪分析是一个非常广泛的话题,有时初学者可能不知如何开始。从超级有用的教程到专门针对该主题的各种课程,文章和论文,那里有大量资源。
在本节中,我们的目标是简要概述不同的材料和资源,以帮助您开始情感分析。
1)阅读基础
在深入探讨情绪分析文献和教程之前,请确保您了解情绪分析的基础知识:
- 这是什么?
- 不同类型的情绪分析。
- 为什么重要?
- 怎么运行的?
以后,如果您有勇气,可以探索更高级的情感分析文献。
2)试用在线演示
学习更多有关情绪分析的过程中的下一步是播放和尝试在线演示,在该演示中,您可以简单地键入消息并测试不同表达式的分析结果。
这对于在情感分析的优缺点和丑陋方面具有第一手经验很有用。通过玩一些实际的例子,您可以快速了解哪种类型的情绪分析令人眼前一亮,像魅力一样起作用。您还将迅速掌握该技术面临的挑战和警告。
3)开始尝试您选择的教程
掌握了基础知识之后,就该动手练习并在您感兴趣的领域上进行实验。为此,我们建议您浏览众多可用的教程,并在您的领域和兴趣中选择一个。
情绪分析演示
如果您得到一个奇怪的结果,则可能是因为该模型尚未正确学习您使用的表达式(尚未)。尝试输入更多的单词,以查看这如何影响结果。
通用情感分析
这是英文文本的一般情感分析分类器。它适用于任何类型的文本。如果不确定使用哪种情感分析模型,则可以使用此模型。
情感分析教程
几乎每个人都有一份情绪分析教程:编码人员,非编码人员,营销人员,数据分析师,支持代理,销售人员,您可以自己命名。在本节中,我们将分享各种教程供您选择,以便您可以在巷子中找到合适的内容,并通过情感分析使自己步履维艰。
编码员情感分析教程
对于那些对代码和API熟悉的人,您可以快速找到各种分步指南和资源。Python是关于数据分析,机器学习和NLP(包括情感分析)的教程中最常用的编程语言,但是R很快赶上了,尤其是针对数据科学家和统计学家的教程。
Python排名前100的子情感的情感分析
该视频教程提供了有关如何使用Python通过其评论的情绪分析排名前100的子指南的分步指南。
首先说明如何使用Beautiful Soup(最流行的Python库之一)进行网页抓取,以便从网页中提取数据。作者使用此库来抓取此网页,以获取前100个子reddit的名称(如/ r / funny,/ r / AskReddit和/ r / todayilearned之类的子reddit)。
获得子目录的名称后,便使用Praw库与Reddit API进行交互,并从这些子目录中提取注释。
最后,作者解释了如何使用TextBlob对提取的注释执行情感分析。
代码:https://github.com/jg-fisher/redditSentiment
使用R对Slack评论进行情感分析
假设我们是Slack团队,我们正在寻找一种简单,可靠的方法来获取有关用户对我们产品的感觉的数据。我们可以转向在线评论,以回答一些最重要的问题。
但是,当有成千上万的评论时,很难对所有这些反馈进行分类并获得我们所寻找的见解。反馈太多,无法手动处理。
它在产品评论网站Capterra上分析了Slack的数千条评论,并从数据中获得了一些深刻的见解。
R对联盟状态的情感分析
Kaggle是与数据科学相关的各种教程的重要资源。在Rachael Tatman撰写的这篇有用的教程中,您可以学习如何使用R进行情感分析。
目的是分析美国总统每年向国会提交的年度信息“国情咨文”。该信息为总统提供了一个机会,向美国公民(和世界)告知政府如何处理对美国重要的问题。
通过分析来自这些国情咨文演讲的不同信息,就有可能获得许多有趣的见解,例如情绪随着时间的推移如何变化,或者总统倾向于发表更消极或正面的演讲。
在本教程中选择的武器是Tidytext软件包,用于使用情感词典和ggplot2软件包来创建我们分析的不同可视化效果。
第一步,作者着手对数据进行标记化,这基本上意味着从演讲中获取文本并将其分解成各个单词。然后,他将这些标记与具有关联的正面或负面情绪(情绪词典)的单词列表进行比较,并使用ggplot软件包创建了一些可视化效果。
在本教程的最后,作者提供了一些练习,这些练习对于获得一些额外的练习以及加深对情绪分析的理解很有用。
使用NLTK的推文情感分析
如果您是Python编码人员,并且想学习如何训练您的第一个文本分类器进行情感分析,那么这是一个很好的分步指南。作者使用自然语言工具包NLTK来训练分类器,该分类器能够预测新推文的情绪。
首先,作者解释了如何从一组预定义的正面和负面推文中提取功能列表。这些功能是一组独特的词,可以用来表示每个推文,并且是训练分类器的关键部分。
然后,您将学习如何准备包含标记的功能集的训练数据。最后,他继续训练Naive Bayes分类器,这是一种简单但功能强大的算法,尤其适用于自然语言处理问题。
训练分类器后,作者将继续说明如何使用此模型对新传入的推文进行分类。
使用R对歌曲进行情感分析
如果您正在寻找使用R进行情感分析的更高级的教程,那么本教程非常适合您。这非常有趣,因为它说明了如何使用Tidytext程序包对Prince的歌曲执行情感分析。
作者首先分析基本信息,例如Prince歌词的词汇多样性。然后,它探讨了不同的情感词典(包括AFINN,Bing和NRC)以及它们如何适合分析Prince的歌词。之后,它继续说明如何有效地对Prince的所有歌曲进行情感分析。一旦有了情感,它就会探索这些年来的歌词情感,并提供关于二元音如何影响情感的实用解释。
本教程需要对整洁的数据有一些基本的了解,因为它使用dplyr进行数据转换,并使用ggplot2进行可视化。
使用Scikit-Learn和Jupyter Notebook的推文情感分析
Scikit-learn是一种简单高效的数据分析工具,最常用于数据分类,回归和聚类。它是机器学习中最常用的库之一,因为它功能强大,但每个人都可以使用。如果您认真学习数据分析和机器学习,那么本教程将帮助您开始使用scikit-learn。
它说明了如何训练逻辑回归模型进行情感分析。首先说明如何正确设置我们的环境,包括jupyter notebook,该应用程序允许快速原型开发和共享与数据相关的项目。
随后,笔者继续讲解如何准备与scikit学习矢量化我们的数据。最后,它训练线性分类器,并显示如何评估模型和计算模型的准确性。
使用MonkeyLearn在Python中进行情感分析
尽管开放源代码框架因其灵活性而很棒,但是如果您没有机器学习或NLP的经验,有时使用它们会很麻烦。大多数开放源代码框架都没有可以立即使用的预训练模型。您将不得不从头开始训练一个。此外,您将需要构建适当的基础结构来训练和部署机器学习模型模型。
相反,您最好尝试使用SaaS API进行情感分析,例如MonkeyLearn。在本教程中,您将学习如何使用MonkeyLearn API 使用Python进行情感分析。您将立即使用带有六行代码的预构建模型来使用情感分析。然后,您将使用MonkeyLearn易于使用的UI来训练自己的自定义模型以进行情感分析。
非技术人员的情感分析教程
直到最近,情绪分析还是一种利基技术,只有具有编码技能和机器学习背景的技术人员才能使用。由于各种可以用来获取数据和运行情感分析模型的工具的兴起,情况已不再如此。
以下是一些教程,可以帮助您开始情感分析,而无需一行代码。
使用Excel进行情感分析
虽然我们都知道如何使用Excel函数处理数字,但是分析电子表格中的文本仍然是一项艰巨而手动的过程。理解文本数据以创建报告和分析趋势需要大量时间。但幸运的是,有更好的方法。您无需花时间遍历每一行,而是手动分析每个文本,而可以将情感分析与Excel结合使用,以节省时间并完成更多工作。
MonkeyLearn为您提供快速,简单的方法来实现这一目标。仅需两个简单的步骤,您就可以将情绪分析直接整合到Excel电子表格中。
首先,您需要选择一种情绪分析模型。您可以使用预先训练的模型进行情感分析,也可以使用自己的数据和条件创建自己的模型。
然后,您只需要上传Excel文件即可使用所选模型运行情感分析。和瞧!MonkeyLearn将返回一个包含原始数据和两个新列的新Excel文件:一个包含情绪分析结果,另一个具有结果的置信度。
Zapier的情感分析
您是否有兴趣对推文进行情感分析?得到您的电子邮件的情感?还是想自动了解来自Typeform调查的答案是肯定的还是否定的?不用担心,您可以使用Zapier之类的工具来连接1000多个应用程序,获取所需的数据,然后运行情绪分析。
之后创建的Zap,你将需要设置的第一步(触发)来获取数据做分析。Zapier提供了多种选择,您可以使用它们从中导入数据,例如Office 365,Google表格,Gmail,Slack,Twitter,Typeform,Evernote,Airtable,Salesforce等。
有了数据之后,您将需要进行第二步设置,以使用MonkeyLearn运行情感分析,MonkeyLearn是一个AI平台,可让您通过机器学习来分析文本。您可以使用预先训练的情绪分析模型,也可以使用自己的数据和条件从头开始构建自己的模型。
第三,通过置信度筛选出样本,以便消除那些可能导致预测不准确的样本。
最后,您应该在快捷菜单上添加第三步以保存结果(例如,在Google Sheets或Excel上的电子表格中)并创建各种数据可视化!
Google表格中的情感分析
使用Google表格和MonkeyLearn的插件进行情感分析非常简单明了。您可以通过以下5个简单的步骤来分析几乎所有类型的文本中的情感。
首先,您必须安装MonkeyLearn的附加组件。为此,请转到加载项/获取加载项,搜索MonkeyLearn,然后将其添加到您的列表中。
其次,复制您的MonkeyLearn的API令牌并将其粘贴到附加的Set令牌文本框中:转到Add-ons / MonkeyLearn并单击Set Token。
第三,启动加载项。转到加载项/ MonkeyLearn,然后单击开始。将会出现一个弹出窗口。您将能够选择要使用的模型(例如,情感分析或推特情感),然后选择要分析的数据。
第四,选择要分析的数据。在“列”或“范围”文本框中键入包含文本的单元格范围,或选择数据并选择“活动范围”进行分析。
最后,单击运行并执行您可以想到的任何类型的分析或可视化。
在本逐步指南中,我们说明了如何充分利用Google表格插件,以帮助您开始进行情绪分析。我们还将介绍一些最佳做法,并提供一些您可以对数据进行有趣操作的示例。
使用RapidMiner进行情感分析
RapidMiner是一个平台,您可以在其中创建数据挖掘流程,而无需成为经验丰富的数据科学家。它提供了一个友好的用户界面,您可以在其中创建完整的数据分析工作流程,包括加载数据,运行机器学习模型以及创建可视化。它使用简单,没有任何编码技能的人可以快速创建自动化流程和数据分析。
通过MonkeyMinute扩展,使用RapidMiner进行情感分析非常简单。
首先,您必须将计算机中的数据(即源)添加到RapidMiner。您可以从CSV文件,数据库上传数据,也可以使用RapidMiner市场上可用的其他数据源从Facebook,SAS,Tableau等源导入数据。
第二步,您必须添加MonkeyLearn分类操作符并将其连接到输入(您的数据)。该运算符允许使用MonkeyLearn上可用的文本分类器,包括专门为情感分析训练的文本分类器。在此步骤中,您必须指定MonkeyLearn API令牌,指定要使用的情感分析模型(模块ID),然后选择输入属性(这是发送给MonkeyLearn进行情感分析的文本)。
最后,您必须将MonkeyLearn分类运算符的输出连接到结果端口,单击“运行”,然后打开!您将获得零行代码对数据进行情感分析的结果!
后续步骤:研究文献
到目前为止,我们已经阅读了情感分析的基础知识,我们已经通过在线演示获得了情感分析模型的第一手经验,并且通过尝试使用本领域的教程来弄清了手。
现在,您渴望提高自己的技能,想详细了解情绪分析,并尝试使用更高级的东西。在这种情况下,合理的下一步就是深入研究和科学文献。
关于情感分析的论文
围绕情感分析的文献众多 ; 有超过55,700篇学术文章,文章,论文,书籍,摘要在那里。
以下是情绪分析社区中最常被引用和阅读的论文:
- 观点挖掘和情感分析(Pang和Lee,2008年)
- 在短语级情感分析中识别上下文极性(Wilson,Wiebe和Hoffmann,2005年)。
- 情感分析与主观性(刘,2010)
- 意见挖掘和情感分析调查(Liu and Zhang,2012)
- 情感分析和观点挖掘(Liu,2012)
有关情感分析的书
刘兵是该领域的佼佼者,他写了一本有声书,对于那些开始进行情感分析的人来说非常有用。刘以出色的技术性和可理解性出色地解释了情绪分析。Liu涵盖了情绪分析的不同方面,包括应用程序,研究,使用有监督和无监督学习的情绪分类,句子主观性,基于方面的情绪分析等等。
课程与讲座
进行情感分析的另一个好方法是掌握自然语言处理(NLP)的知识和技能,该自然语言处理是专注于理解“人类”语言的计算机科学领域。
通过将机器学习,计算语言学和计算机科学相结合,NLP使机器能够理解自然语言,包括人们从书面语言中获得的情感,评价,态度和情感。
网上有大量的课程,讲座和资源,但必不可少的NLP课程是Dan Jurafsky和Christopher Manning编写的Stanford Coursera课程。通过学习本课程,您将获得NLP社区中两个最著名的名字对该领域的逐步介绍。
如果您想了解更多动手课程,则应该在Udemy上使用Python进行数据科学:自然语言处理(NLP)。本课程为您很好地介绍了NLP及其功能,但是它也使您可以使用Python构建不同的项目,包括垃圾邮件检测器,情感分析器和文章微调器。大多数讲座的时间都很短(约5分钟),并且该课程在实践和理论内容之间找到了适当的平衡。
情绪分析数据集
掌握情绪分析的关键部分是研究不同的数据集并尝试不同的方法。为此,您首先需要动手处理数据并获取数据集,然后根据您的领域和兴趣在该数据集上进行实验。
以下是一些我们最喜欢的情感分析数据集,用于尝试情感分析和机器学习方法。它们是开放的,可以免费下载:
- 产品评论:该数据集包含数百万个具有星级评分的Amazon客户评论,对于训练情绪分析模型非常有用。
- 餐厅评论:该数据集包括520万个Yelp评论(具有星级)。
- 电影评论:此数据集包含1,000条正面评论和1,000条负面评论。它还提供了5,331个肯定的处理和5,331个否定的处理的句子/摘要。
- 美食评论:该数据集包含来自亚马逊的约500,000条美食评论。它包括产品和用户信息,评分以及每个评论的纯文本版本。
- Kaggle上的Twitter航空公司情绪:该数据集包含约15,000条有关航空公司的带标签的推文(正面,中性和负面)。
- 第一个GOP辩论Twitter情绪:此数据集包含约14,000条有关2016年第一次GOP辩论的带标签的推文(正面,中性和负面)。
如果您对基于规则的方法感兴趣,下面是将方便使用的各种情感分析词典。这些词典提供了一组带有指定其跨不同领域的情感的标签的单词词典。以下词典对于确定文本的情感非常有用:
- 情感词典81种语言:此数据集包含81种语言的积极和消极情感词典。
- SentiWordNet:此数据集包含约29,000个单词,情感评分在0到1之间。
- 用于情感分析的意见词典:此数据集提供了英语中的4,782个负面词和2,005个正面词的列表。
- Wordstat情感词典:此数据集包括〜4800个肯定词和〜9000个否定词。
- 表情表情词典:此数据集包含477个表情图标的列表,分别标记为正,中性或负。
情绪分析工具和API
情感分析系统上有多个选项,可以通过API或用户界面使用。从广义上讲,它们可以分为两个不同的类别:
- 开源库
- SaaS工具
开源库
在开源库中,存在诸如Python或Java之类的编程语言,因为它们具有强大的数据科学社区,因此,它们的位置特别优越,因此,包括自然语言处理在内的数据科学的开源库也是如此。在所有这些情况下,您必须具有丰富的机器学习和编程知识,才能成功使用这些库。
适用于Python的情感分析API
Python是数据科学的顶级编程语言之一,它拥有强大的社区和实现NLP模型的大量选项。
以下是杰出的示例:
Scikit-learn是机器学习的首选库,并且具有用于文本向量化的有用工具。在诸如频率或tf-idf文本矢量化器之类的矢量化基础上训练分类器非常简单。Scikit-learn具有支持向量机,朴素贝叶斯和Logistic回归等实现。
NLTK是用于Python的传统NLP库。它拥有活跃的社区,除了为NLP提供低级功能外,还提供了训练机器学习分类器的可能性。
SpaCy是另一个具有不断发展的社区的NLP最新图书馆。与NLTK一样,它为NLP提供了一组强大的低级功能,并支持训练文本分类器。
随着深度学习的趋势,在最近几年中,已经开发了一套新的数据科学库,这些库支持NLP应用程序。一些最杰出的:
TensorFlow。它由Google开发,提供了一组底层工具来构建和训练神经网络。在传统的词频上以及通过词嵌入的更高级词法上,还支持文本向量化。
Keras提供有用的抽象来与多种神经网络类型(例如递归神经网络(RNN)和卷积神经网络(CNN))一起使用,并轻松堆叠神经元层。Keras可以在Tensorflow或Theano之上运行。它还提供了用于文本分类的有用工具。
PyTorch是最近的深度学习框架,得到了一些著名组织的支持,例如Facebook,Twitter,Nvidia,Salesforce,斯坦福大学,牛津大学和Uber。它迅速建立了强大的社区。
Java中的情感分析API
Java是另一种编程语言,在数据科学领域拥有强大的社区,并为NLP提供了出色的数据科学库。
- OpenNLP:一种工具包,支持最常见的NLP任务,例如标记化,句子分段,词性标记,命名实体提取,分块,解析,语言检测和共指解析。
- Stanford CoreNLP:The Stanford NLP Group提供的Java核心NLP工具套件。
- Lingpipe:使用计算语言学处理文本的Java工具包。LingPipe通常用于文本分类和实体提取。
- Weka:由怀卡托大学创建的一组工具,用于数据预处理,分类,回归,聚类,关联规则和可视化。
情绪分析SaaS工具
从头开始实施情感分析系统并非易事。通常,公司需要在以下方面花费大量时间,金钱和资源:
- 拥有数据科学团队。
- 拥有开发团队。
- 部署和扩展基础架构以训练和运行模型。
- 实施和部署API以使用模型。
- 实施工具来标记培训示例。
- 调整模型超参数。
如果您想避免这些麻烦,或者您不知道如何编码,那么一个很好的选择是使用情绪分析工具,该工具通常可以解决上述大多数问题。您可以通过它们的API和任何编程语言在任何系统中轻松使用它们。构建软件的编程语言很多,但很少有强大的数据科学库。这些工具的另一个主要优点是,您甚至不需要知道如何编码。它们提供了与第三方应用程序(例如Google Sheets,Excel和Zapier)的集成,因此您可以立即使用情感分析来分析数据。
以下是值得一看的情绪分析工具列表:
- 猴子学习
- Google Cloud NLP
- 沃森
- 亚马逊理解
- Lexalytics
- 艾琳
- 含义云
- 玫瑰花环
分词
情感分析可以应用于无数业务领域,从品牌监控到产品分析,从客户服务到市场研究。通过将其整合到他们现有的系统和分析中,领先的品牌(更不用说整个城市)能够更快,更准确地朝着更有用的方向努力。
情感分析已不再只是有趣的高科技想法,而且很快将成为现代所有公司必不可少的工具。最终,情感分析使我们能够收集新的见解,更好地了解我们的客户并更有效地授权自己的团队,从而使他们做得更好,更富有成效。
MonkeyLearn是一个在线平台,可让您轻松地使用机器学习来分析文本。
如果您需要帮助建立为您的企业景气分析系统,达到了,我们会帮助您开始使用。
本文发布于网文江湖,来自翻译文章。