Python 自然语言处理
推荐一本免费的在线电子书,《用Python进行自然语言处理》, 用NLP 工具包(开源免费,Python)来进行文本分析。特别适合初学计算语言学的学生。好像没有好的中文切词。当然,免不了需要提一下 Dan Jurafsky 教授,大家可以搜索一下,找找他的讲义。
简要翻译一下提纲:
(书的主站点:http://www.nltk.org/)
序言
用Python进行语言处理
使用文本语料库和辞典资源
处理原始文本
结构化变成
词语的分类和标签
学习文本分类
从文本中信息抽取
分析句法结构
创建基于特征的语法
分析句子的意思
管理语言学数据
后记:直面语言带来的挑战
Natural Language Processing with Python
— Analyzing Text with the Natural Language Toolkit
Steven Bird, Ewan Klein, and Edward Loper
0. Preface (extras)
1. Language Processing and Python (extras)
2. Accessing Text Corpora and Lexical Resources (extras)
3. Processing Raw Text
- Writing Structured Programs (extras)
- Categorizing and Tagging Words
- Learning to Classify Text (extras)
7. Extracting Information from Text
8. Analyzing Sentence Structure (extras)
9. Building Feature Based Grammars
10. Analyzing the Meaning of Sentences (extras)
11. Managing Linguistic Data
12. Afterword: Facing the Language Challenge
转载于酷壳CoolShell 无删改 仅以此纪念陈皓(左耳朵耗子)
起因: 使用某个通讯软件的机器人转发器,发放邀请码的时候,在转发链接的同时,有不明来源的 ip 来点击,高度怀疑信息泄露可能有安全隐患 加上这几天工作不太忙,有点自己的时间,想…
听说阿里云的通义千问 API 收费了,看了下价格。 阿里云 ==> 0.12 元/1000tokens 我看了下,我最近 20 天就用了大概 1000 * 1000 token…
在我们用C/C++开发的过程中,总是有一个问题会给我们带来苦恼。这个问题就是函数内和函数外代码需要通过一块内存来交互(比如,函数返回字符串),这个问题困扰和很多开发人员。如果…