Simsimi是一款手机应用,就是聊天机器人,一只黄色的小鸡。现在iPhone上和Android上都已经发布了,很受女生欢迎,在微博上经常能看到她们把和小鸡的对话截图发出来。我用Android手机尝试了下,总结一下感受和想法。

1、该应用支持多国语言,对中文的支持还算不错,其实多语言支持只要改下界面就行了。其核心的智能聊天功能我任务是不受语言限制的,只需要将输入的字符串转码处理就行。

2、机器人一般都需要学习,Simsimi的学习方式有两种。一种是当小鸡不知道如何回答,或者你觉得有更合适的回答,那你可以教它如何回答,就是直接告诉他答案,不过你需要先用Facebook或者Twitter登陆。第二种是小鸡的回答你觉得看不懂,不满意,那你可以对该回答投一票Bug,当有2票Bug时,该答案就会被删掉了。

3、相信很多非IT专业的人不明白为什么Simsimi会消耗流量,认为这就是个单机应用,怎么会要联网呢。其实之前说到机器人需要学习,小鸡学了很多的语句,但是显然不可能存在手机存储上,因为知识需要更新,而且靠一个玩家的教学效果是不明显的,所以数据需要存在服务器端,靠所有玩家来更新小鸡的知识库,所以在你提问的时候必须先联网,而且网速问题也会影响到小鸡的响应速度。

4、短语的处理方式,小杰认为短语,比如一个字,两个字的词,这类的语义比较明确,Simsimi可以直接从服务器端找到对应的答案来回答,当然答案一般是会有多条,因为会有很多人教它这个短语的回答,一般比较合适的都不会被人投Bug删掉。刚上线的时候可以初始一些常用短语并设置好回答,然后就能根据用户的反馈信息不断自动更新。但是长句就不能直接找对应回答的数据,因为长句的变化太多,经常会找不到,但一些语义相近的句子已经被小鸡学习了,也就是已经有回答存储在服务器了,那就需要先对长句进行语义分析,这个目前来说比较难,我就不具体细说了。

Simsimi 开发

虽然Simsimi现在更新了很多其他功能,像成就系统等,不过其核心还是需要靠大量的数据,所以积累越久,小鸡的回答也会越精准。所以,小鸡的猥琐其实反映了大部分玩家的猥琐。

如果想要自己开发一个简单的聊天机器人,可以像Simsimi这样,靠用户反馈信息来更新数据,让机器人学习。对于人工智能来说,这只算是冰山一角,作为本科生的我研究的很肤浅,有哪里说的不对,还请大家轻拍。