第十二章
下列选项中,主要用来获得根词的是( )。
答案:WordNetLemmatizer
下列分词模式中,可以将句子中所有成词词语都扫描出来的是( )。下列方法中,用于返回出现相对较频繁的单词的是( )。关于文本预处理的过程,下列描述错误的是( )。如果希望还原单词的基本形式,则需要使用import语句导入哪个模块?( )关于词性归一化的说法中,下列描述正确的是( )。下列选项中,可以用来提取词干的是( )。NLP主要是实现人与计算机之间用英文进行有效沟通。( )词干提取能够捕捉基于词根的规范单词形式。( )如果两个向量的夹角越小,则表示它们越不相似。( )若某个词在这些文本中出现的次数最多,则表示这个单词比较具有代表性。( )如果将cut()函数的cut_all参数设为False,则表示按照全模式进行分词。( )NLTK是一套基于Python的自然语言处理工具包。( )如果将cut()函数的cut_all参数设为False,则表示的是按照精确模式进行分词,( )文本分词是预处理过程中必不可少的一个操作。( )我们可以直接使用pip命令安装jieba库。( )中文并没有一个形式上的分界符。( )

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部