优草派  >   Python

Pandas读取在线数据怎么做?Python使用pandas库如何读取在线文件

罗西汉            来源:优草派

python数据处理第三方库pandas能够来读取Excel、csv、redis以及其他各种不同类型的文件数据,而使用它甚至是可以来读取在线文件数据的。下面文章中所介绍的内容就是python读取在线文件数据的方法教程,想学习的小伙伴就一起往下看看吧。

Pandas读取在线数据怎么做?Python使用pandas库如何读取在线文件

1.读取在线文件数据根据情况不同也是有不同方式的,第一种情况就是这个在线文件是读取到了网页之中并且显示出来了。那么就可以直接去调用read_html()方法读取这个在线数据,读取完成之后会自动将其转为Dataframe类型。

不过这种方式需要注意链接的获取,因为在线文件数据读取出来之后,它链接也会相应的改变,代码示例如下所示:

import pandas as pd
url = "https://zh.m.wikipedia.org/zh/%E5%A5%A
df = pd.read_html(url)

这个方法读取出来的在线数据会保持原来的格式不变,而链接最后面的不是乱码,而是这个在线文件显示在该页面之后,将其单独作为网页打开之后的链接。

2.另外一种方式使用的情况也是特定的,那就是这个在线文件直接是以链接形式出现的,因为这种形式只需要将其在网页中打开就可以将其下载。而pandas库读取该类型在线文件,实际上是将文件下载之后再获取其内容。

而代码中也是先用get()方法将这个文件内容获取到,然后将文件进行解码操作,再根据它实际类型去调用对应的方法,详细代码示例如下所示:

import pandas as pd
import request
url="https://raw.githubusercontent.com/ountries.csv"
response=requests.get(url).content 
df2 = pd.read_csv(io.StringIO(response.decode('utf-8')))

以上就是关于“Pandas读取在线数据怎么做?Python使用pandas库如何读取在线文件”的全部内容了,希望对你有所帮助。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。