WRW Blog

Thinking will not overcome fear but action will.

数学之美学习笔记5

第五章 隐马尔可夫模型 通信模型 齐次马尔可夫假设 独立性假设 隐马尔可夫模型 隐含马尔可夫模型的训练

数学之美学习笔记4

第四章 中文分词 中文分词的演变

Stop words with NLTK

Stop words with NLTK from nltk.corpus import stopwords from nltk.tokenize import word_tokenize example_sent = “This is a sample sentence, showing off the stop words filtration.” stop_words = set...

Tokenizing Words and Sentences with NLTK

Tokenizing Words and Sentences with NLTK from nltk.tokenize import sent_tokenize, word_tokenize EXAMPLE_TEXT = “Hello Mr. Smith, how are you doing today? The weather is great, and Python is aweso...

统计学习方法学习笔记1

第一章 统计学习方法概论 输入实例的特征向量为 输入变量与输出变量均为连续变量的预测问题称为回归问题,输出变量为有限个离散变量的预测问题称为分类问题,输入变量与输出变量均为变量序列的预测问题称为标注问题.

数学之美学习笔记3

第三章 统计语言模型 用数学的方法描述语言规律 模型的训练、零概率问题和平滑方法 小结

Review on Recent Advances in Information Mining From Big Consumer Opinion Data for Product Design

用于产品设计的消费者评论数据挖掘最新进展综述 摘要 Studies on information extraction of big consumer opinion data are explained from various perspectives, including data acquisition, opinion target recognition, feature id...

数学之美学习笔记2

第二章 自然语言处理-从规则到统计 基于规则的自然语言处理 从规则到统计 小结

数学之美学习笔记1

第一章 文字和语言 VS 数字和信息 小结

NLP学习笔记3

NLP学习笔记3