使用Python获得股票数据的最佳方式是什么

使用Python获得股票数据的最佳方式是什么

在这篇文章中,我们将学习使用Python获得股票数据的最佳方法。

yfinance Python库将被用来从雅虎财经检索当前和历史的股票市场价格数据。

安装雅虎财经(yfinance)

获取股票市场数据的最佳平台之一是雅虎财经。只需从雅虎财经网站下载数据集,并使用yfinance库和Python编程访问它。

你可以在pip的帮助下安装yfinance,你所要做的就是打开命令提示符,在语法中输入以下命令显示。

语法

pip install yfinance

yfinance库最好的部分是,它可以免费使用,而且不需要API密钥。

如何获得股票价格的当前数据

我们需要找到一个股票的代码,我们可以用它来提取数据。我们将在下面的例子中显示GOOGL的当前市场价格和之前的收盘价。

示例

下面的程序使用yfinance模块返回市场价格值、前收盘价值、股票价值。

import yfinance as yf
ticker = yf.Ticker('GOOGL').info
marketPrice = ticker['regularMarketPrice']
previousClosePrice = ticker['regularMarketPreviousClose']
print('Ticker Value: GOOGL')
print('Market Price Value:', marketPrice)
print('Previous Close Price Value:', previousClosePrice)

输出

在执行时,上述程序将产生以下输出 –

Ticker Value: GOOGL
Market Price Value: 92.83
Previous Close Price Value: 93.71

如何获得股票价格的历史数据

通过给出开始日期、结束日期和股票代码,我们可以获得完整的历史价格数据。

示例

下面的程序返回开始和结束日期之间的股票价格数据:

# importing the yfinance package
import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# printing the last 5 rows of the data
print(resultData.tail())

输出

在执行时,上述程序将产生以下输出 –

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close Volume
Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

上面的例子将检索出2015-03-01至2017-03-01的股票价格数据。

如果你想同时从几个股票市场获取数据,请以空格分隔的字符串形式提供这些股票。

为分析而转换数据

Date 是数据集的索引,而不是上面数据集例子中的列。在对其进行任何数据分析之前,你必须将这个索引转换成列。下面是如何做的—

示例

下面的程序将列名添加到开始和结束日期之间的股票数据中—-。

import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# Setting date as index
resultData["Date"] = resultData.index

# Giving column names
resultData = resultData[["Date", "Open", "High","Low", "Close", "Adj Close", "Volume"]]

# Resetting the index values
resultData.reset_index(drop=True, inplace=True)

# getting the first 5 rows of the data
print(resultData.head())

输出

在执行时,上述程序将产生以下输出 –

[*********************100%***********************] 1 of 1 completed
   Date      Open       High     Low       Close     Adj Close  Volume

0 2015-03-02 28.350000 28.799500 28.157499 28.750999 28.750999 50406000
1 2015-03-03 28.817499 29.042500 28.525000 28.939501 28.939501 50526000
2 2015-03-04 28.848499 29.081499 28.625999 28.916500 28.916500 37964000
3 2015-03-05 28.981001 29.160000 28.911501 29.071501 29.071501 35918000
4 2015-03-06 29.100000 29.139000 28.603001 28.645000 28.645000 37592000

上述转换后的数据和我们从雅虎财经获得的数据是相同的

将获得的数据存储在CSV文件中

to_csv()方法可以用来将DataFrame对象导出到CSV文件中。下面的代码将帮助你导出CSV文件中的数据,因为上述转换后的数据已经在pandas数据框中。

# importing yfinance module with an alias name
import yfinance as yf

# giving the start and end dates
startDate = '2015-03-01'
endDate = '2017-03-01'

# setting the ticker value
ticker = 'GOOGL'

# downloading the data of the ticker value between
# the start and end dates
resultData = yf.download(ticker, startDate, endDate)

# printing the last 5 rows of the data
print(resultData.tail())

# exporting/converting the above data to a CSV file
resultData.to_csv("outputGOOGL.csv")

输出

在执行时,上述程序将产生以下输出 –

[*********************100%***********************] 1 of 1 completed
            Open      High     Low       Close     Adj Close  Volume

Date
2017-02-22 42.400002 42.689499 42.335499 42.568001 42.568001 24488000
2017-02-23 42.554001 42.631001 42.125000 42.549999 42.549999 27734000
2017-02-24 42.382500 42.417999 42.147999 42.390499 42.390499 26924000
2017-02-27 42.247501 42.533501 42.150501 42.483501 42.483501 20206000
2017-02-28 42.367500 42.441502 42.071999 42.246498 42.246498 27662000

数据的可视化

yfinance Python模块是最容易设置、收集数据和进行数据分析活动的模块之一。使用Matplotlib、Seaborn或Bokeh等软件包,你可以将结果可视化并捕捉到洞察力。

你甚至可以使用PyScript在网页上直接显示这些可视化的内容。

结论

在这篇文章中,我们学习了如何使用Python yfinance模块来获得最佳的股票数据。此外,我们还学习了如何获得指定时期的所有股票数据,如何通过添加自定义索引和列进行数据分析,以及如何将这些数据转换为CSV文件。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Python 教程