本文作者:罗天尧 新疆大学商学院
本文编辑:陈梦鹭
技术总编:郭泽源
Stata and Python 数据分析
Chat Completions 接口新增了Function calling功能。
更新了gpt-4-0613和gpt-3.5-turbo-0613模型(gpt-3.5-turbo-0301和gpt-4-0314模型即将落幕)。GPT4内测倒计时!
-
新增了gpt-3.5-turbo的16k版,32k版正在路上!gpt-3.5-turbo成本降低了25%!gpt-3.5-turbo-16k略贵,但全量文本分析指日可待! -
以davinci为主的embedding模型,成本降低了75%!离自建向量库又进了一步!
function_descriptions = [
{
"name": "get_score", #自定义函数名
"description": "Get the score by given name", #对定义函数的描述,提升精确度
"parameters": { #
"type": "object",
"properties": {
"name": { #对传入参数的格式等定义
"type": "string",
"description": "Object name",
}
},
"required": ["name"], #必须传入的参数
},
}
]
user_query = "How about Alex this year?"
model="gpt-3.5-turbo-0613"
OPENAI_API_KEY = "U KEY~"

name = eval(resp['function_call']['arguments']).get("name")
print(name) #Alex
import json
SCORES = { 'Alex': 99, 'Peter': 88 } #模拟数据库
def get_score(name): #自定义函数
score = {
"name": name,
"score": SCORES[name]
}
return json.dumps(score)
print(get_score(name=name)) #{"name": "Alex", "score": 99}
response = openai.ChatCompletion.create(
model=model,
messages=[
{"role": "user", "content": user_query},
resp,
{
"role": "function", #这里让他以get_score函数的身份回答
"name": "get_score",
"content": get_score(name=name),
},
],
)
print(response['choices'][0]['message']['content']) #Alex has scored 99 this year.
重磅福利!为了更好地服务各位同学的研究,爬虫俱乐部将在小鹅通平台上持续提供金融研究所需要的各类指标,包括上市公司十大股东、股价崩盘、投资效率、融资约束、企业避税、分析师跟踪、净资产收益率、资产回报率、国际四大审计、托宾Q值、第一大股东持股比例、账面市值比、沪深A股上市公司研究常用控制变量等一系列深加工数据,基于各交易所信息披露的数据利用Stata在实现数据实时更新的同时还将不断上线更多的数据指标。我们以最前沿的数据处理技术、最好的服务质量、最大的诚意望能助力大家的研究工作!相关数据链接,请大家访问:(https://appbqiqpzi66527.h5.xiaoeknow.com/homepage/10)或扫描二维码:
对我们的推文累计打赏超过1000元,我们即可给您开具发票,发票类别为“咨询费”。用心做事,不负您的支持!
爬虫俱乐部重磅推出cnstata.com.cn
Markdown:让数学公式输入更方便!
What’ new ? 速通Stata 18
用`fs`命令批量获取文件夹和不同文件夹下的excel文件
自然语言处理之实例应用JSON帮手,FeHelper
微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识,欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。
武汉字符串数据科技有限公司一直为广大用户提供数据采集和分析的服务工作,如果您有这方面的需求,请发邮件到statatraining@163.com,或者直接联系我们的数据中台总工程司海涛先生,电话:18203668525,wechat: super4ht。海涛先生曾长期在香港大学从事研究工作,现为知名985大学的博士生,爬虫俱乐部网络爬虫技术和正则表达式的课程负责人。
此外,欢迎大家踊跃投稿,介绍一些关于Stata和Python的数据处理和分析技巧。

