Python 自然语言处理
推荐一本免费的在线电子书,《用Python进行自然语言处理》, 用NLP 工具包(开源免费,Python)来进行文本分析。特别适合初学计算语言学的学生。好像没有好的中文切词。当然,免不了需要提一下 Dan Jurafsky 教授,大家可以搜索一下,找找他的讲义。
简要翻译一下提纲:
(书的主站点:http://www.nltk.org/)
序言
用Python进行语言处理
使用文本语料库和辞典资源
处理原始文本
结构化变成
词语的分类和标签
学习文本分类
从文本中信息抽取
分析句法结构
创建基于特征的语法
分析句子的意思
管理语言学数据
后记:直面语言带来的挑战
Natural Language Processing with Python
— Analyzing Text with the Natural Language Toolkit
Steven Bird, Ewan Klein, and Edward Loper
0. Preface (extras)
1. Language Processing and Python (extras)
2. Accessing Text Corpora and Lexical Resources (extras)
3. Processing Raw Text
- Writing Structured Programs (extras)
- Categorizing and Tagging Words
- Learning to Classify Text (extras)
7. Extracting Information from Text
8. Analyzing Sentence Structure (extras)
9. Building Feature Based Grammars
10. Analyzing the Meaning of Sentences (extras)
11. Managing Linguistic Data
12. Afterword: Facing the Language Challenge
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
自从 windows95 开始,都是开个 command.com + IDE 。之后只不过换成了 cmd.exe + IDE 。再后来 WSL+IDE 。冲浪都在浏览器,不直接…
本人产品狗一枚,趁着都在讨论 cursor ,也做个浏览器扩展来玩玩,顺便分享下 cursor 使用心得。本人不能说对技术完全没了解,毕竟经常跟开发大佬打交道略有耳闻一些术语,…
这几天系统地学习了一下Lua这个脚本语言,Lua脚本是一个很轻量级的脚本,也是号称性能最高的脚本,用在很多需要性能的地方,比如:游戏脚本,nginx,wireshark的脚本,…