为啥我主张如今的研讨生学点编程_分析

原标题:为啥我主张如今的研讨生学点编程?

2021·国庆·杭州 | python爬虫与文本分析作业坊 & 课题申报高档研修班

在曩昔的两年间,python一路高歌猛进,成功窜上“最火编程言语”的宝座。惊奇的是运用python最多的人群其实不是程序员,而是数据科学家,特别是社会科学家,包括的学科有经济学、打点学、会计学、社会学、传达学、新闻学等等。

大数据年代到来,网络数据正变成潜在瑰宝,许多商业信息、社会信息以文本等非规划化、异构型数据格局存储于页面中。非核算机专业布景的人也可凭仗机器学习、人工智能等办法进行研讨。运用网络世界数据进行研讨,面临两大难点:

数据的获取

文本(非规划化)数据的处置与分析

数据获取需要凭仗python编程言语方案网络爬虫,而获得的数据中有恰当比例数据对错规划化数据,这就需要文本数据分析技能。本次课程参照已宣告的社科类的文章,期望协助我们处置文本分析这最难的两大难点。课程方案的初衷是用最少的时刻让我们学到最有用的常识点,降低学习难度。期望学习完本课程后能让各位联系研讨需要对自个学科内的文本分析有一个全部深化的晓得,便利各位打开后续研讨。

多重优惠福利

原价499元,如今限时特价199元。

收购后可建议组队,组队成功的队长可全免学费

扫下方二维码生成自个的课代表共享卡还有机缘每单赚23.88元

聘请卡1个月有用期,失效后可加微信:372335839, 补白”网课”

课程方针

学会python言语根柢语法

掌控python爬虫根来历理

会方案和开发python爬虫

掌控文本分析有关库

理身手据发掘,特别是文本分析的思路和流程

晓得文本分类、文本聚类

主讲教师

大邓,哈尔滨工业大学(hit)打点学院信息打点体系方向在读博士。曾在多所大学做 网络数据搜集和文本分析 共享,运营有【大众号:大邓和他的python】,首要共享python、爬虫、文本分析、机器学习等有关内容。

合适人群

本课程面向目标有:

0编程基础

想从网上爬数据

想做文本分析

想晓得机器学习

包括但不限于以上几类人群。

内容要害第一有些 环境装备(1小时)

python简介

python设备

pycharm设备

jupyter notebook设备

第三方库设备办法

第二有些 python快速入门(2小时)

根柢语法

数据规划-list、str、dict、tuple、s

et

for循环、if逻辑

try-except

常用函数

事例1:爬虫代码中各常识点运用情况

事例2:文本分析代码中各常识点运用情况

第三有些 python网络爬虫快速入门(2小时)

网络爬虫原理

requests库

bs4库

元素(数据)定位

数据抓包

数据存储(txt,csv)

事例1:豆瓣网数据抓取

事例2:知乎网站数据抓取

第四有些 快速入门python文本分析(1.5小时)

文本分析使用场景

txt、pdf、word等类型文件的数据读取

中文分词-jieba库

天然言语处置-nltk库

可视化-pyecharts库

数据分析-pandas库

事例1-词频计算

事例2-制造词云图

事例3-excel文件中时刻及文本数据处置办法

事例4-运用情感词典进行情感核算

第五有些 文本分析进阶篇(1.5小时)

监督学习与非监督学习

运用机器学习进行文本分析的进程

表达文本数据信息的方法(独热编码、词袋法、tf-idf)

了解特征矩阵、语料、文档、特征

机器学习库-sklearn语法学习

晓得协同过滤-举荐体系

事例1-文本情感分析

事例2-文本分类(以20news数据集为例)

事例3-lda论题模型

事例4-核算花费者购物偏好

文本分析有关文献

学习课程时,可以参阅阅览以下文献,晓得如何在社科类研讨中运用文本分析

[1]沈艳,陈赟,黄卓.文本大数据分析在经济学和金融学中的使用:一个文献总述[eb/ol].http://www.ccer.pku.edu.cn/yjcg/tlg/242968.htm,2021-11-19

[2]loughran t, mcdonald b. textual analysis in accounting and finance: a survey[j]. journal of accounting research, 2016, 54(4): 1187-1230.

author links open overlay panelcomputational socioeconomics

[3]魏伟,郭崇慧,陈静锋.国务院政府作业陈述(1954—2021)文本发掘及社会变迁研讨[j].情报学报,2021,37(04):406-421.

[4]孟庆斌, 杨俊华, 鲁冰. 打点层谈论与分析宣告的信息含量与股价崩盘风险——根据文本向量化办法的研讨[j]. 我国工业经济, 2021 (12): 132-150.

[5]王伟,陈伟,祝效国,王洪伟. 众筹融资成功率与言语个性的说服性-根据kickstarter的实证研讨.打点世界.2016;5:81-98.

[6]chan j t k, zhong w. reading china: predicting policy change with machine learning[j]. 2021.

[7]hansen s, mcmahon m. shocking language: understanding the macroeconomic effects of central bank communication[j]. journal of international economics, 2016, 99: s114-s133.

[8]wang, quan, beibei li, and param vir singh. “copycats vs. original mobile apps: a machine learning copycat-detection method and empirical analysis.” information systems research 29.2 (2021): 273-291.

网课将有对应的线下作业坊,面临面学起来更快更简略,具体信息可点击下方蓝色字查看

2021·国庆·杭州 | python爬虫与文本分析作业坊 & 课题申报高档研修班

1

等待扫码征询!!

记住补白“网课(或作业坊)”回来搜狐,查看更多

责任修改:

评论