2019-10-17发表2024-03-02更新自然语言处理15 分钟读完 (大约2231个字)simple-jieba:用 100 行实现简单版本的 jieba 分词众所周知,jieba 分词是一个不错的中文分词工具包,今天我们尝试用 100 行代码实现一个简单版本的 jieba 分词。阅读更多
2018-06-23发表2024-03-02更新自然语言处理8 分钟读完 (大约1204个字)机械分词实战:南京 / 市长 / 江大桥 ?这次我们从最简单的机械分词上手,来感受一下平常调个包就能解决事情,摸起来是什么样子的。阅读更多
2018-04-26发表2024-03-02更新自然语言处理9 分钟读完 (大约1275个字)分词 / 是 / 什么 / ?词是能够独立活动的最小语言单位。在自然语言处理中,通常都是以词作为基本单位进行处理的。由于英文本身具有天生的优势,以空格划分所有词。阅读更多