使用Python获得股票数据的最佳方式是什么
在这篇文章中,我们将学习使用Python获得股票数据的最佳方法。
yfinance Python库将被用来从雅虎财经检索当前和历史的股票市场价格数据。
安装雅虎财经(yfinance)
获取股票市场数据的最佳平台之一是雅虎财经。只需从雅虎财经网站下载数据集,并使用yfinance库和Python编程访问它。
你可以在pip的帮助下安装yfinance,你所要做的就是打开命令提示符,在语法中输入以下命令显示。
语法
pip install yfinance
yfinance库最好的部分是,它可以免费使用,而且不需要API密钥。
如何获得股票价格的当前数据
我们需要找到一个股票的代码,我们可以用它来提取数据。我们将在下面的例子中显示GOOGL的当前市场价格和之前的收盘价。
示例
下面的程序使用yfinance模块返回市场价格值、前收盘价值、股票价值。
import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('Ticker Value: GOOGL')
print('Market Price Value:', marketPrice)
print('Previous Close Price Value:', previousClosePrice)
输出
在执行时,上述程序将产生以下输出 –
Ticker Value: GOOGL
Market Price Value: 92.83
Previous Close Price Value: 93.71
如何获得股票价格的历史数据
通过给出开始日期、结束日期和股票代码,我们可以获得完整的历史价格数据。
示例
下面的程序返回开始和结束日期之间的股票价格数据:
# importing the yfinance package
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# printing the last 5 rows of the data
print(resultData.tail())
输出
在执行时,上述程序将产生以下输出 –
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
上面的例子将检索出2015-03-01至2017-03-01的股票价格数据。
如果你想同时从几个股票市场获取数据,请以空格分隔的字符串形式提供这些股票。
为分析而转换数据
Date 是数据集的索引,而不是上面数据集例子中的列。在对其进行任何数据分析之前,你必须将这个索引转换成列。下面是如何做的—
示例
下面的程序将列名添加到开始和结束日期之间的股票数据中—-。
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# Setting date as index
resultData["Date"] = resultData.index
# Giving column names
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]
# Resetting the index values
resultData.reset_index(drop=True, inplace=True)
# getting the first 5 rows of the data
print(resultData.head())
输出
在执行时,上述程序将产生以下输出 –
[*********************100%***********************] 1 of 1 completed
Date Open High Low Close Adj Close Volume
0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000
上述转换后的数据和我们从雅虎财经获得的数据是相同的
将获得的数据存储在CSV文件中
to_csv()方法可以用来将DataFrame对象导出到CSV文件中。下面的代码将帮助你导出CSV文件中的数据,因为上述转换后的数据已经在pandas数据框中。
# importing yfinance module with an alias name
import yfinance as yf
# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'
# setting the ticker value
ticker = 'GOOGL'
# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)
# printing the last 5 rows of the data
print(resultData.tail())
# exporting/converting the above data to a CSV file
resultData.to_csv("outputGOOGL.csv")
输出
在执行时,上述程序将产生以下输出 –
[*********************100%***********************] 1 of 1 completed
Open High Low Close Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000
数据的可视化
yfinance Python模块是最容易设置、收集数据和进行数据分析活动的模块之一。使用Matplotlib、Seaborn或Bokeh等软件包,你可以将结果可视化并捕捉到洞察力。
你甚至可以使用PyScript在网页上直接显示这些可视化的内容。
结论
在这篇文章中,我们学习了如何使用Python yfinance模块来获得最佳的股票数据。此外,我们还学习了如何获得指定时期的所有股票数据,如何通过添加自定义索引和列进行数据分析,以及如何将这些数据转换为CSV文件。