• 14
基于HowNet的NLP技术,语知科技打造新型语言理解技术服务平台
统计 阅读时间大约5分钟(1898字)

2017-08-15 基于HowNet的NLP技术,语知科技打造新型语言理解技术服务平台

让计算机真正理解自然语言。

【猎云网(微信号:ilieyun)北京】8月15日报道(文/都保杰)

让机器更好的理解人类的自然语言一直是NLP(自然语言处理)技术的核心发展目标。现阶段, NLP技术+深度学习已广泛应用在人工智能各个领域,包括人机智能交互、知识图谱、文本信息大数据处理、舆情监控、多语种翻译等等。但是,我们在具体体验产品的时候会经常遇到答非所问、翻译不准、机器听不懂人话等人工智障现象,这种行业普遍问题能不能改进一下呢?

猎云网日前采访到了北京语知科技有限公司,据了解,现有的主流深度学习算法主要是依靠多GPU和多机器的分布式训练,基于词层面对大量标注数据进行计算得出的算法模型,在语义理解上有天然不足。而语知科技通过HowNet(知网) 独有的语言知识系统和概念描述体系,能够得到准确的语义信息,可使深度学习直接在语义或概念层面进行计算,有利于提高计算机理解自然语言的深度和准确度。

语知科技创始人兼CEO王语介绍:“语知科技的定位可以简单理解为是以一家自然语言理解AI技术提供商,我们为企业做知识图谱建设、舆情分析、机器翻译甚至是智能硬件等应用提供底层的NLP技术支持,一方面我们能提供NLP底层技术接口的服务,另一方面我们也可以为特殊客户提供定制化、私有云部署的NLP应用方案,解决数据安全问题。”

插图

据了解,语知科技的NLP技术特色在于利用HowNet的知识系统,可以充分的融合各种NLP处理技术,包括:规则、统计、大数据、深度学习等。HowNet知识系统是一个可供计算机处理的本体知识库,不仅在哲学上、体系上而且在可计算的实现上解决了什么是世界知识以及如何将这样的知识服务于各种实际应用的问题。HowNet的哲学基础、建构体系和描述方法独具特色,HowNet以结构化语言科学地、贴切地描述了中英两种语言各20余万概念和义项,在这样的基础上形成了严谨的上下位概念体系,能够准确反映概念及其属性之间的关系。

因此,语知科技在语义分析方面优势明显,它可以处理的文本可以是超句的段落或篇章,并且系统的分析结果可揭示五种类型的内容:词语之间的句法关系,词语之间的逻辑语义关系,词语之间的深层逻辑语义关系,通过逻辑语义角色转换得到的深层理解,以及各个词语的词性、义项、拼音及其对应的英语译文。

插图1

语知科技目前提供的NLU基础技术服务主要包括:中英文分词,词性词义标注、词语相关度计算、词语相似度计算、情感分析、语义排歧、中英文语义分析、命名实体识别、信息提取和挖掘、事件关系推理及角色转换等。

这些技术在现实生活中有什么具体应用和商业化价值呢?王语介绍,语知科技刚刚成立两周以来,吸引了大量NLP潜在客户,有来自智能硬件企业,机器翻译企业、大型银行,大数据公司等等,这里有几个典型应用场景案例可以分享。

语知在互联网舆情监控有较为丰富的经验,早期技术应用在军事领域。产品的口碑分析,例如一款新车发布后的网络评论,留言产生了大量的文本资料,怎么抽取观点分类?哪些是正面哪些是负面?哪些有研究参考价值?语知科技将网络数据进行清洗加工归类,经过分词、分类、关系识别等智能文本分析,最终可为企业得出一个准确详细的分析报告。

未标题-2

在语音交互方面,语知科技以分词和词性标注为基础,分析语音指令中的关键名词、动词、数量、时间等,能够大幅提高语音指令解析的精准度,提升用户体验。多轮交互式搜索通过专名识别定位多轮对话中的核心实体,可自动判断后续对话中对该实体的进一步信息需求。

在实体数据库构建方面,通过词性标注、命名体识别 ,协助知识图谱建立
,挖掘实体之间、实体与关键词之间的关联,构建实体信息(如人物、地名、机构等)数据库,例如银行可以针对一些大客户建立数据库进行风控预警,汇总分析网络公开数据即可实现对客户运营情况的定期分析或者实时监测,降低财务风险。

在智能硬件领域,例如翻译机,实时翻译需要联网利用多GPU多进程计算,但如果没网络或者边缘设备就需要本地计算,而类似翻译机这种小型AI设备无法安装GPU,语知科技可以把语言解析程序固化到芯片里面,降低计算难度和计算量的同时,还能够提升翻译的准确度。

此外,基于HowNet知识体系构建起来的自然语言处理解析的方式,让语知科技NLP技术在语言理解、知识挖掘、跨语种相关度、相似度等应用场景都有着独特的技术优势。

语知科技目前刚成立还不到一个月时间,关于接下来的发展规划,王语表示公司正在筹备天使轮融资,计划组建一支20~30人左右的高精尖技术研发团队。语知科技将把技术开放出去,不单单是开放NLP技术接口,还要在知识架构,概念的语义关系等核心技术上开放。长远一点来看,王语希望把语知科技的NLP技术与深度学习在知识层面相融合,在人工智能学术层面实现研究突破,让机器从感知进化到认知,进而为工业界起到更大的推进作用。

据了解,学术界一直在深入探讨如何把知识和深度学习更好的结合,人工智能正在寻找自然语言处理上的突破。在今年的AI技术顶级会议ACL2017和IJCAI2017上,分别有两篇论文是基于HowNet知识系统完成的论文被收纳。一篇是Improved Word Representation Learning with Sememes,作者是清华大学的牛艺霖、谢若冰、刘知远、孙茂松教授;另一篇是Lexical Sememe Prediction via Word Embeddings and Matrix Factorization,作者是来自清华大学的袁星驰,谢若冰,刘知远和孙茂松教授。

 

产品:基于知网的NLP技术
公司:北京语知科技有限公司
网址:http://www.yuzhinlp.com

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×