?365bet平台注册 南方现代物流公共信息平台 _365bet日博娱乐_365bet平台注册_365bet吧
 
 
<返回
 
自然预言处理及自定义情绪分析
发布日期: 2014-09-10 17:26:07 来源:本站 作者:本站编辑 查看:436
分享:

 就在不久之前,大家都赌定飞行汽车和拟人机器人在2014年之前就会出现。

现在可以确定的是,飞行汽车的幻想破灭了,机器人也没能达到人们预想的样子。但是人类却实现了可以理解语言的“人工智能技术”。

这有点吓人?听起来似乎是的。但在笔者看来更多的是酷酷的感觉。

当人工智能语言被用来理解人类语言时,我们称(这种技术)为“自然语言处理”(NLP)。大多数用来解析文本的NLP引擎都带有一项叫做“情绪分析”的功能。通过该技术,我们可以知道一段文本带有正面,负面或是中性的情绪。

好的NLP引擎会将每一个词或短语标注情绪。举例来说,“糟糕的”就是一个带有负面情绪的词,而“美味的”则是正面情绪词。“蓝色的椅子”则是一个中性词。

情绪分析同时也会告诉我们一整段文字的属性。举例来说,如果一条微博说:“服务很差劲,但食物却很美味。”那么它会被认为是中性的。这是因为一个正面情绪词和一个负面情绪词相互抵消了效果而变成了中性。

好的NLP引擎不仅对每个单词或词组赋予的情绪打分,同时会对整个文本的情绪打分。所以在上述例子里,我们就能知晓,整个微博是中性的,但是其中分别有着有价值的正面和负面信息。

情绪分析的一大问题就是它有时候会出错,但这只是我们必须要面对的一个局限而已。笔者的意思是,就一般人而言,在一半的情形下对文本的情绪判断都会产生分歧。即使是专业学生,也会有百分之二十的情况下会产生分歧。

“老兄,那个碉堡了!”(Oh man,that was nasty!)这句是正面情绪还是负面情绪呢?

当然,这“肯定”是负面情绪。“Nasty”(原义是糟糕,恶心)是一个负面的词,而这句里别的词都是中性词,所以最后的结果:负面情绪!撒花!

错!这句是正面情绪的句子!(Nasty在俚语中是“棒极了”的意思。)

说这句话的人使用的是美语俚语中nasty的含义,而这是一个正面的词。但是如果单单从这句话中,我们是无法判断的。如果作为人类的你也掉进了我们刚刚的这个小陷阱,我们又怎么能要求机器搞明白这个呢?这里的答案是,你可以去“教”机器哪些是正面情绪,哪些是负面情绪。

高质量的NLP引擎可以允许你自定义情绪分析中的设置。”Nasty”默认是负面情绪词。但如果你使用带有正面情绪的俚语中的“nasty”时,你可以登录引擎使用情绪的自定义功能,把这个单词给予一个正面情绪的分数。

更优秀的NLP引擎可以使整个的进程变得轻而易举。如果没有这样的自定义功能,这个机器有可能在工作中变得一无是处。所以当你选择情绪分析的引擎时,一定要确保它含有自定义的功能。

不然的话,你所面对的就是一个逐字句机械式翻译的机器而无法得到更精确的结果。

 

 
 
 
365bet日博娱乐|联系方式
Copyright © 2013 All rights reserved. 南方现代物流公共信息平台 | 粤ICP备12063495号-2