近日,阿里AI在常识QA领域的权威数据集CommonsenseQA上刷新世界纪录,超过微软取得第一名,显著提升AI的常识推理能力。这一技术是“95后”实习生叶志秀在达摩院科学家指导下完成的实习成果。
CommonsenseQA是为了研究基于常识知识的问答而提出的数据集,比此前的SWAG、SQuAD数据集难度更高。目前最流行的语言模型BERT在SWAG、SQuAD上的性能已经接近或超过人类,但在CommonsenseQA上的准确率还远低于人类。
CommonsenseQA数据集上的常识问题,大拇指朝上的选项为正确答案
自然语言理解(NLP,Natural Language Processing)是人工智能皇冠上的明珠,常识推理则是难度最高的NLP任务之一。在机器翻译、阅读理解等NL...
点击查看剩余70%
网友评论0