2019-10-16自然语言处理15 分钟 读完 (大约 2231 个字)simple-jieba:用 100 行实现简单版本的 jieba 分词众所周知,jieba 分词是一个不错的中文分词工具包,今天我们尝试用 100 行代码实现一个简单版本的 jieba 分词。阅读更多
2018-08-27自然语言处理17 分钟 读完 (大约 2581 个字)词嵌入1:从「分布表示」说起「Word Embedding」之于自然语言处理,犹如「Inception Net」之于计算机视觉!阅读更多
2018-06-23自然语言处理8 分钟 读完 (大约 1204 个字)机械分词实战:南京 / 市长 / 江大桥 ?这次我们从最简单的机械分词上手,来感受一下平常调个包就能解决事情,摸起来是什么样子的。阅读更多
2018-04-26自然语言处理9 分钟 读完 (大约 1275 个字)分词 / 是 / 什么 / ?词是能够独立活动的最小语言单位。在自然语言处理中,通常都是以词作为基本单位进行处理的。由于英文本身具有天生的优势,以空格划分所有词。阅读更多