2021-01-27发表2024-03-02更新自然语言处理9 分钟读完 (大约1303个字)词嵌入2:Word2Vec 详解Word2Vec 是词向量发展前期的伟大工作,我们一起来看看它的细节。阅读更多
2019-10-17发表2024-03-02更新自然语言处理15 分钟读完 (大约2231个字)simple-jieba:用 100 行实现简单版本的 jieba 分词众所周知,jieba 分词是一个不错的中文分词工具包,今天我们尝试用 100 行代码实现一个简单版本的 jieba 分词。阅读更多
2018-08-27发表2024-03-02更新自然语言处理17 分钟读完 (大约2581个字)词嵌入1:从「分布表示」说起「Word Embedding」之于自然语言处理,犹如「Inception Net」之于计算机视觉!阅读更多
2018-06-23发表2024-03-02更新自然语言处理8 分钟读完 (大约1204个字)机械分词实战:南京 / 市长 / 江大桥 ?这次我们从最简单的机械分词上手,来感受一下平常调个包就能解决事情,摸起来是什么样子的。阅读更多
2018-04-26发表2024-03-02更新自然语言处理9 分钟读完 (大约1275个字)分词 / 是 / 什么 / ?词是能够独立活动的最小语言单位。在自然语言处理中,通常都是以词作为基本单位进行处理的。由于英文本身具有天生的优势,以空格划分所有词。阅读更多