随笔吧量化投资选股的python程序实践（附源码）

2017-10-14 17:27阅读：

http://blog.sina.cn/dpool/blog/u/5713043118

量化投资选股的python程序实践（附源码）
首先选取沪深股票市场，本人比较关注的12只股票：
000002 万科A，600566 济川药业，300051 三五互联，002039 黔源电力，600872 中炬高新，300324旋极信息，600885 宏发股份，600382 广东明珠，000732 泰和集团，002174 游族网络，000915 山大华特，002415 海康威视
备注：如果是基金经理，则会有研究部门推荐的股票选择池

程序运行的得到结论如下：
1. 当投资组合的sharp值最大时，投资组合为：
41.2%的万科A，10.5%的广东明珠，38.2%的山大华特，10.1%的海康威视
该组合的未来预期年化收益为：21.4%
该组合的预期年化波动率为：29.5%
该组合的sharp指数为0.725

2. 当投资组合的波动最小时，投资组合为：
34.5%的万科A，17.9%的济川药业，24.6%的黔源电力，2%的旋极信息，1%的宏发股份，9.4%的泰和集团，0.8%的游族网络，9.8%的海康威视
该组合的未来预期年化收益为：3.7%
该组合的预期年化波动率为：22.6%
该组合的sharp指数为0.163

相关输出图表如下：
图1：关注的12只股票从20

16-01-01到2016-12-01的归一化股价走势
随笔吧量化投资选股的python程序实践（附源码）

随笔吧量化投资选股的python程序实践（附源码）

图2：10万次蒙特卡洛模拟计算，得到各种投资组合以及相应收益率和波动率
随笔吧量化投资选股的python程序实践（附源码）

随笔吧量化投资选股的python程序实践（附源码）

图3：有效前沿、最优投资组合的图
#叉号：构成的曲线是有效前沿（efficient frontier，目标收益率下最优的投资组合）
#红星：夏普值最大的投资组合
#黄星：方差最小的投资组合
随笔吧量化投资选股的python程序实践（附源码）

随笔吧量化投资选股的python程序实践（附源码）

程序源代码以及详细注释说明如下：
# -*- coding: utf-8 -*-
'''
Created on Thu Dec  8 01:26:52 2016

@author: Administrator
'''

import pandas as pd
import numpy as np
#import statsmodels.api as sm #统计运算
#import scipy.stats as scs #科学计算
import matplotlib.pyplot as plt #绘图
import pandas.io.data as web
#import tushare as ts


# 1.选取感兴趣的股票

# 000002 万科A，600566 济川药业，300051 三五互联，002039 黔源电力，600872 中炬高新，300324 旋极信息，600885 宏发股份，600382 广东明珠，000732 泰和集团，002174 游族网络，000915 山大华特，002415 海康威视
# 并比较一下数据（2016-01-01至2016-12-01）

symbols = ['000002.sz','600566.ss','300051.sz','002039.sz','600872.ss','300324.sz','600885.ss','600382.ss','000732.sz','002174.sz','000915.sz','002415.sz']

noa = len(symbols)

data = pd.DataFrame()
for sym in symbols:
    data[sym] = web.DataReader(sym, data_source='yahoo',start='2016-01-01',
                               end='2016-12-01')['Adj Close']
data.columns = symbols

data.head(5)

(data / data.ix[0] * 100).plot(figsize=(16, 10), grid=True)


#2.计算不同证券的均值、协方差
#每年252个交易日，用每日收益得到年化收益。计算投资资产的协方差是构建资产组合过程的核心部分。运用pandas内置方法生产协方差矩阵。
returns = np.log(data / data.shift(1))

returns.mean()*252

returns.cov()*252


#3.给不同资产随机分配初始权重
#由于A股不允许建立空头头寸，所有的权重系数均在0-1之间
weights = np.random.random(noa)

weights /= np.sum(weights)

weights


# 4.计算预期组合年化收益、组合方差和组合标准差
np.sum(returns.mean()*weights)*252

np.dot(weights.T, np.dot(returns.cov()*252,weights))

np.sqrt(np.dot(weights.T, np.dot(returns.cov()* 252,weights)))


# 5.用蒙特卡洛模拟产生大量随机组合
#进行到此，我们最想知道的是给定的一个股票池（证券组合）如何找到风险和收益平衡的位置。
#下面通过一次蒙特卡洛模拟，产生大量随机的权重向量，并记录随机组合的预期收益和方差。

port_returns = []

port_variance = []

for p in range(100000):

    weights = np.random.random(noa)

    weights /=np.sum(weights)

    port_returns.append(np.sum(returns.mean()*252*weights))

    port_variance.append(np.sqrt(np.dot(weights.T, np.dot(returns.cov()*252, weights))))

port_returns = np.array(port_returns)

port_variance = np.array(port_variance)

#无风险利率设定为3%

risk_free = 0.03

plt.figure(figsize = (16,8))

plt.scatter(port_variance, port_returns, c=(port_returns-risk_free)/port_variance, marker = 'o')

plt.grid(True)

plt.xlabel('excepted volatility')

plt.ylabel('expected return')

plt.colorbar(label = 'Sharpe ratio')


#6.投资组合优化1——sharpe最大
#建立statistics函数来记录重要的投资组合统计数据（收益，方差和夏普比）
#通过对约束最优问题的求解，得到最优解。其中约束是权重总和为1。


def statistics(weights):

    weights = np.array(weights)

    port_returns = np.sum(returns.mean()*weights)*252

    port_variance = np.sqrt(np.dot(weights.T, np.dot(returns.cov()*252,weights)))

    return np.array([port_returns, port_variance, port_returns/port_variance])

#最优化投资组合的推导是一个约束最优化问题

import scipy.optimize as sco

#最小化夏普指数的负值

def min_sharpe(weights):

    return -statistics(weights)[2]

#约束是所有参数(权重)的总和为1。这可以用minimize函数的约定表达如下

cons = ({'type':'eq', 'fun':lambda x: np.sum(x)-1})

#我们还将参数值(权重)限制在0和1之间。这些值以多个元组组成的一个元组形式提供给最小化函数

bnds = tuple((0,1) for x in range(noa))

#优化函数调用中忽略的唯一输入是起始参数列表(对权重的初始猜测)。我们简单的使用平均分布。

opts = sco.minimize(min_sharpe, noa*[1./noa,], method = 'SLSQP', bounds = bnds, constraints = cons)

opts

#得到的最优组合权重向量为：
opts['x'].round(3)

#sharpe最大的组合3个统计数据分别为：
#预期收益率、预期波动率、最优夏普指数
statistics(opts['x']).round(3)


#7.投资组合优化2——方差最小
#接下来，我们通过方差最小来选出最优投资组合。
#但是我们定义一个函数对方差进行最小化

def min_variance(weights):

    return statistics(weights)[1]

optv = sco.minimize(min_variance, noa*[1./noa,],method = 'SLSQP', bounds = bnds, constraints = cons)

optv


#方差最小的最优组合权重向量及组合的统计数据分别为：
optv['x'].round(3)

#得到的预期收益率、波动率和夏普指数
statistics(optv['x']).round(3)




#8.组合的有效前沿
#有效前沿有既定的目标收益率下方差最小的投资组合构成。
#在最优化时采用两个约束，1.给定目标收益率，2.投资组合权重和为1。

def min_variance(weights):

    return statistics(weights)[1]

#在不同目标收益率水平（target_returns）循环时，最小化的一个约束条件会变化。

target_returns = np.linspace(0.0,0.5,50)

target_variance = []

for tar in target_returns:
    cons = ({'type':'eq','fun':lambda x:statistics(x)[0]-tar},{'type':'eq','fun':lambda x:np.sum(x)-1})
    res = sco.minimize(min_variance, noa*[1./noa,],method = 'SLSQP', bounds = bnds, constraints = cons)
    target_variance.append(res['fun'])

target_variance = np.array(target_variance)
len(target_variance)

#下面是最优化结果的展示。
#叉号：构成的曲线是有效前沿（目标收益率下最优的投资组合）
#红星：sharpe最大的投资组合
#黄星：方差最小的投资组合

plt.figure(figsize = (16,8))

#圆圈：蒙特卡洛随机产生的组合分布



plt.scatter(port_variance, port_returns, c = port_returns/port_variance,marker = 'o')

#叉号：有效前沿
len(target_variance),len(target_returns)
plt.scatter(target_variance,target_returns, c = target_returns/target_variance, marker = 'x')

#红星：标记最高sharpe组合

plt.plot(statistics(opts['x'])[1], statistics(opts['x'])[0], 'r*', markersize = 15.0)

#黄星：标记最小方差组合

plt.plot(statistics(optv['x'])[1], statistics(optv['x'])[0], 'y*', markersize = 15.0)

plt.grid(True)

plt.xlabel('expected volatility')

plt.ylabel('expected return')

plt.colorbar(label = 'Sharpe ratio')

'''
#df = ts.get_hist_data(stock_set[0], '2016-01-01', '2016-12-01')['close']
#df.head(10)

df = [[]]*noa
data = [[]]*noa

# type(df)
for i in range(0, noa):
    #print(stock_set[i])
    df[i] = ts.get_hist_data(stock_set[i], '2016-01-01', '2016-12-01')
    data[i] = df[i]['close']

df[0]['close'].head(10)
'''

举报/Report

我的更多文章

下载客户端阅读体验更佳