()是自然语言处理的重要应用,也可以说是最基础的应用。
()是自然语言处理的重要应用,也可以说是最基础的应用。
A、文本识别
B、机器翻译
C、文本分类
D、问答系统
正确答案:C
答案解析:
A选项文本识别:严格意义上它更偏向于光学字符识别(OCR)技术范畴,主要是将图像中的文字转换为可编辑的文本,重点在于文字的提取,并非自然语言处理对文本语义、语法等方面的处理应用,所以A选项不符合。
B选项机器翻译:是将一种自然语言转换为另一种自然语言,虽然是自然语言处理的重要应用,但它需要依赖文本分类、语义理解等基础技术。在进行机器翻译时,首先要对源文本进行分析,而这其中文本分类等基础处理是必不可少的环节,所以它不是最基础的应用,B选项不正确。
C选项文本分类:是自然语言处理中最基础的应用之一。它将文本按照预设类别进行归类,这个过程涉及对文本的特征提取、语义理解等基础的自然语言处理操作。许多其他自然语言处理任务,如情感分析(可看作特殊的文本分类,分为积极、消极等类别)、信息检索中的文档归类等都以文本分类为基础。通过文本分类,可以对大量文本进行初步的整理和分析,为后续更复杂的自然语言处理任务提供支持,所以C选项正确。
D选项问答系统:需要理解用户问题并基于知识库给出准确回答,它依赖于自然语言理解、知识表示与推理等多种技术,而这些技术又依赖文本分类等基础处理。问答系统相对来说是较为复杂和高级的应用,并非最基础的应用,所以D选项错误。