《文本挖掘(基于R语言的整洁工具)》(美)茱莉亚·斯拉格//戴维·罗宾逊机械工业出版社豆瓣PDF电子书网盘迅雷下载在线免费阅读-Fahrenheit英汉词典

书名

文本挖掘(基于R语言的整洁工具)

分类

作者

(美)茱莉亚·斯拉格//戴维·罗宾逊

出版社

机械工业出版社

下载

抱歉，不提供下载，请购买正版图书。

简介

编辑推荐

茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。tidytext包提供的函数相对简单，但如何使用这个包则很重要。因此，本书还提供了真实的、极具吸引力的文本挖掘案例。

本书重点介绍实际软件实例和数据展示，几乎没有公式，但是有大量的代码。

内容推荐

当前很多数据都是非结构化的大规模文本，这给分析和可视化带来了挑战。茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》使用实用的tidytext软件包来介绍文本挖掘技术，该包是由Julia Silge和David Robinson共同开发的R软件包（类似于ggplot2和dplyr软件包），开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。

本书展示如何将文本转换为数据框，然后提取和可视化文本的特征；并介绍如何将自然语言处理（NLP）融入有效的工作流程中；实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。

前言

第1章整洁文本格式

比较整洁文本结构与其他数据结构

unnest_tokens函数

整理Jane Austen的作品

gutenbergr包

词频

总结

第2章基于整洁数据的情感分析

情感数据集

内连接的情感分析

比较三个情感词典

最常见的正面单词和负面单词

Wordclouds模块

除单词外的其他文本单元

总结

第3章分析词和文件频率：tf-idf

Jane Austen小说中的词项频率

Zipf定律

bind_tf_idf函数

物理学语料库

总结

第4章词之间的关系：n-gram及相关性

n-gram词条化

用widyr包对单词对计数并计算相关性

总结

第5章非整洁格式转换

使文档-词项矩阵整洁

将整洁文本数据转换为矩阵

总结

第6章主题建模

LDA

示例：博大的图书馆馆藏

LDA方法的替代实现

总结

第7章案例研究：Twitter归档文件比较

单词使用情况的比较

单词使用情况的变化

收藏和转发

总结

第8章案例研究：NASA元数据挖掘

NASA如何组织数据

共现单词与相关单词

计算描述字段的tf-idf

总结

第9章案例研究：分析Usenet文本

预处理

新闻组中的单词

情感分析

总结

参考文献

随便看

Fahrenheit英汉词典电子书栏目提供海量电子书在线免费阅读及下载。

书名	文本挖掘(基于R语言的整洁工具)
分类
作者	(美)茱莉亚·斯拉格//戴维·罗宾逊
出版社	机械工业出版社
下载	抱歉，不提供下载，请购买正版图书。
简介	编辑推荐茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》介绍了如何使用tidytext包以及其他基于R语言的tidy工具来进行文本挖掘。tidytext包提供的函数相对简单，但如何使用这个包则很重要。因此，本书还提供了真实的、极具吸引力的文本挖掘案例。本书重点介绍实际软件实例和数据展示，几乎没有公式，但是有大量的代码。内容推荐当前很多数据都是非结构化的大规模文本，这给分析和可视化带来了挑战。茱莉亚·斯拉格、戴维·罗宾逊著的《文本挖掘(基于R语言的整洁工具)》使用实用的tidytext软件包来介绍文本挖掘技术，该包是由Julia Silge和David Robinson共同开发的R软件包（类似于ggplot2和dplyr软件包），开发时采用了整洁原则。本书将会介绍如何利用tidytext以及其他整洁工具使文本分析变得更容易、更有效。本书展示如何将文本转换为数据框，然后提取和可视化文本的特征；并介绍如何将自然语言处理（NLP）融入有效的工作流程中；实用的代码示例和数据分析将帮助你了解文学作品、新闻和社交媒体中的有用信息。目录前言第1章整洁文本格式比较整洁文本结构与其他数据结构 unnest_tokens函数整理Jane Austen的作品 gutenbergr包词频总结第2章基于整洁数据的情感分析情感数据集内连接的情感分析比较三个情感词典最常见的正面单词和负面单词 Wordclouds模块除单词外的其他文本单元总结第3章分析词和文件频率：tf-idf Jane Austen小说中的词项频率 Zipf定律 bind_tf_idf函数物理学语料库总结第4章词之间的关系：n-gram及相关性 n-gram词条化用widyr包对单词对计数并计算相关性总结第5章非整洁格式转换使文档-词项矩阵整洁将整洁文本数据转换为矩阵总结第6章主题建模 LDA 示例：博大的图书馆馆藏 LDA方法的替代实现总结第7章案例研究：Twitter归档文件比较单词使用情况的比较单词使用情况的变化收藏和转发总结第8章案例研究：NASA元数据挖掘 NASA如何组织数据共现单词与相关单词计算描述字段的tf-idf 总结第9章案例研究：分析Usenet文本预处理新闻组中的单词情感分析总结参考文献
随便看	老重庆民俗漫画(精) 吃货秘籍之绝味小炒菜吃货秘籍之开胃下饭菜农民工城市生活手册(修订版)/农民工有困难找工会丛书 Visual Basic开发实例大全(附光盘基础卷)/软件工程师开发大系中国艺术品收藏鉴赏(珍藏版)(精) 海水沉积物溢油污染监测评价指导手册中华人民共和国政府采购法实施条例释义中国区域金融稳定报告(2014) 中国区域金融稳定报告(2015) 中国农村教育阶层再生产功能的文化分析写一手好字做一个好人(漕泾小学书法教育纪实) 2014农村养老国情调研--景观叙事觉解(上海财经大学千村调查定点大学生田野日志) 东滩刑事诉讼法2012年修正案实施情况调研(以四川省眉山市人民检察院为样本)/程序法论评清华园里的人生咏叹调(精) 亲和力(精)/世界名著名译文库背德者(纪德集)(精)/世界名著名译文库东京下町古书店(第1卷摇滚爱书魂) 东京下町古书店(第4卷番外篇背负天皇密令的华族之女) 东京下町古书店(第3卷守护爱情的羊男) 东京下町古书店(第2卷传递爱的使者) 主持艺术(第3版) 政治问责论道法无常(新加坡公共管理之道) 什么什么万谢的成语什么什么万谷的成语什么什么万象的成语什么什么万货的成语什么什么万贯的成语什么什么万转的成语什么什么万轴的成语什么什么万轸的成语什么什么万载的成语什么什么万选的成语什么什么万遍的成语什么什么万里的成语什么什么万重的成语什么什么万钧的成语什么什么万错的成语七夕有送鸳鸯荔枝者（明·郑潜）七夕有雨（元末明初·徐贲）七夕木兰堂社集晚泛（明·邓云霄）七夕杂诗仿曝书亭体其三（清·萧道管）七夕杂诗仿曝书亭体（清·萧道管）七夕杂诗（明·张嗣垣）七夕梦梅花（清·黄宗羲）七夕次万山韵（元末明初·陶宗仪）七夕次吕佥宪韵（明·刘崧）七夕次嶰筠韵三首（清·林则徐）七夕次苏校书韵（明·王汝玉）七夕次韵仲至（宋·韩淲）七夕次韵（宋·李吕）七夕次鲤南韵四首（清末民国初·曹家达）七夕歌（元·吾丘衍）冰花炖蛋韭菜馅饼炸香椿肉丸芒果糯米饭五指毛桃鹿茸菇鸽子汤饭团生菜木耳拌虾仁枸杞芽拌鸽胸肉凉拌海带煎饺排骨青菜海带汤香椿拌豆腐蒜薹烧豆腐香酥小油条紫菜肉丸汤