python爬虫入门——邓旭 东PPT讲座
自我介绍
2009-2013 哈尔滨工业大学经济管理学院 2015-至今 中南大学商学院 主要研究方向为线上社群及消费者行为,
在学习研究过程中,习得了数据科学相关技术, 如数据采集、数据清理、数据规整、统计分析
熟悉R、python、MongoDB。
元组tuple
(1,2,3,4) (’1’, ‘2’, ‘3’, ‘4’)
(‘a’, ’b’, ’c’, ’d’)
集合set
{‘a’, ’b’, ’c’} 集合是不重复的元素组成的一个基本数据类型。
字典dict
>>>Dict = {‘name’: ‘邓旭东’,
‘age’: 26,
浏览器显示效果
Python基本知识
基本数据类型(str,list,tuple,set,dict)
循环语句 (for循环)
条件语句 (if else while)
表达式
(如age = 20)
字符串str
字符串:单(双、三)引号及其夹住的字符 >>>String = ‘我叫邓旭东’ >>>String[2:5]
Requests是一个优雅简洁的Python HTTP库,给人类使用。
requests常用方法
最普通的访问
url = ‘/u/1562c7f164’ r = requests.get(url)
伪装成浏览器的访问
Headers = {‘User-Agent’: ’Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36’} r = requests.get(url,headers = Headers)