使用Python获取股票数据的最佳方法是什么?
在本文中,我们将学习使用Python获取股票数据的最佳方法。
yfinance Python库将用于从Yahoo Finance检索当前和历史的股票市场价格数据。
更多Python相关文章,请阅读:Python 教程
安装Yahoo Finance(yfinance)
获取股票市场数据的最佳平台之一是Yahoo Finance。只需从Yahoo Finance网站上下载数据集,然后使用yfinance和Python编程进行访问即可。
您可以使用pip来安装yfinance,只需打开命令提示符并键入以下语法所示的命令即可:
语法
pip install yfinance
yfinance库的最佳部分是,可以免费使用,无需API密钥。
如何获取股票价格的当前数据
我们需要找到股票的代码,我们可以用它进行数据提取。我们将在以下示例中显示GOOGL的当前市场价和前一个收盘价。
示例
以下程序使用yfinance模块返回市场价值、前一个收盘价值和代码值:
import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('代码值: GOOGL')
print('市场价值:', marketPrice)
print('前一个收盘价值:', previousClosePrice)
输出
在执行上述程序后,将生成以下输出:
代码值: GOOGL
市场价值: 92.83
前一个收盘价值: 93.71
如何获取股票价格的历史数据
通过提供开始日期、结束日期和代码,我们可以获取完整的历史价格数据。
示例
以下程序返回开始日期和结束日期之间的股票价格数据:
# 导入yfinance包
import yfinance as yf
# 设置开始和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'
# 设置代码值
ticker = 'GOOGL'
# 下载开始和结束日期之间代码值的数据
resultData = yf.download(ticker, startDate, endDate)
# 打印数据的最后5行
print(resultData.tail())
输出
在执行上述程序后,将生成以下输出:
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
上面的示例将从2015-03-01到2017-03-01检索股票价格数据。
如果您想同时从多个代码提取数据,请将代码作为以空格分隔的字符串提供。
转换数据以进行分析
在上面示例的数据集中, 日期 是数据集的索引,而不是列。在对其进行任何数据分析之前,您必须将此索引转换为列。以下是如何执行此操作:
示例
以下程序将列名添加到开始和结束日期之间的股票数据中:
import yfinance as yf
# 给定开始和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'
# 设置股票代码
ticker = 'GOOGL'
# 在开始和结束日期之间下载股票数据
resultData = yf.download(ticker, startDate, endDate)
# 将日期设置为索引
resultData["Date"] = resultData.index
# 给定列名
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]
# 重置索引值
resultData.reset_index(drop=True, inplace=True)
# 获取前5行数据
print(resultData.head())
输出
执行以上程序之后,将会生成如下输出 –
[*********************100%***********************] 1 of 1 completed
Date Open High Low Close Adj Close Volume
0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000
上述转换后的数据和我们从Yahoo Finance获取的数据是一致的。
将获取的数据存储在 CSV 文件中
to_csv() 方法可用于将DataFrame对象导出到CSV文件。如下代码将帮助您按照上面转换的数据将数据导出到CSV文件中,因为原始数据已经在Pandas DataFrame中。
# 导入带有别名名称的yfinance模块
import yfinance as yf
# 给定开始和结束日期
startDate = '2015-03-01'
endDate = '2017-03-01'
# 设置股票代码
ticker = 'GOOGL'
# 在开始和结束日期之间下载股票数据
resultData = yf.download(ticker, startDate, endDate)
# 打印数据的最后5行
print(resultData.tail())
# 导出/转换以上数据到 CSV 文件中
resultData.to_csv("outputGOOGL.csv")
输出
执行以上程序之后,将会生成如下输出 –
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
可视化数据
Python yfinance模块是设置最简单、收集数据最方便、执行数据分析最容易的模块之一。使用Matplotlib、Seaborn或Bokeh等包,您可以将结果可视化并捕获见解甚至可以使用PyScript将这些可视化直接显示在网页上。
结论
在本文中,我们学习了如何使用Python yfinance模块获取最佳股票数据。此外,我们还学习了如何获取指定期间的所有股票数据、如何通过添加自定义索引和列进行数据分析、以及如何将此数据转换为CSV文件。