什么都是计算机理解通过感官世界,学习和经验,IBM沃森说呢?首先,成吨的数据。
要构建知识体系为沃森与危害的工作中,研究人员放在一起2亿页内容,结构化和非结构化,包括字典和百科全书。当记者问一个问题,沃森开始分析它使用超过100种算法,识别任何姓名,日期,地理位置或其他实体。还考察了短语结构和问题,以更好地判断对方的问题的语法。总之,它使用数百万的逻辑规则来确定最佳答案。
+ MORE ON沃森:沃森的名字,数据的游戏|一路上沃森的丰富多彩的历史里程碑|下面是对我们的健康,从沃森帮助+
今天,沃森经常被应用到新的领域,学习新材料的手段。研究人员首先通过加载Word文档,PDF文件或网页到沃森建立自己的知识。那么问题和答案对被加入到训练沃森的主题。要回答一个问题,沃森的搜索数以百万计的文件,找到数千可能的答案。一路上它收集证据和使用评分算法率每个项目的质量。在此基础上打分,它跻身所有可能的答案,并提供最好的一个。下面的视频详细介绍了该过程。
随着时间的推移,沃森从经验中学习。它作为新的信息发布也自动更新。在坚果方面和螺栓,沃森使用IBM的DeepQA与各种其他专有和开源技术的一起软件。在其原来的形式,即包含的Hadoop和Apache UIMA(非结构化信息管理架构)软件和90级电源750的计算机包装总共2880个处理器核的簇。
今天,沃森通过云交付,但由于竞争加剧,IBM是保持沉默的底层细节。
“我们的DeepQA推理等基本认知能力利用深学习技术,专有算法和开源内核,并且利用了为这些工作负载优化的硬件技术架构,” IBM沃森副总裁兼首席技术官罗布·高说。