文心一言 4.0 是百度推出的新一代大语言模型,凭借强大的逻辑推理、代码生成及多模态理解能力,广泛应用于智能客服、内容创作及企业数据分析等场景。本教程将带您从零开始,掌握文心一言 4.0 API 的核心调用方法。学完本课程,您将能够独立搭建基于该模型的智能应用,理解参数调优策略,并具备解决常见集成问题的能力,为构建专属 AI 助手打下坚实基础。
API Key 和 Secret Key。pip install qianfan 安装百度官方 SDK,或通过 pip install requests 使用原生 HTTP 请求方式。首先,我们需要在代码中配置密钥以通过身份验证。创建一个名为 main.py 的文件,输入以下代码:
import qianfan
# 替换为您真实的密钥
qianfan.AK = "您的 API_KEY"
qianfan.SK = "您的 SECRET_KEY"
注意:切勿将密钥硬编码后上传至公共代码仓库,建议使用环境变量管理。预期结果为程序无报错加载,成功建立与千帆平台的连接基础。

接下来,调用文心一言 4.0 模型进行首次对话。我们指定模型名称为 ernie-4.0-8k,并发送一条测试指令:
chat_comp = qianfan.ChatCompletion()
resp = chat_comp.do(
model="ernie-4.0-8k",
messages=[{"role": "user", "content": "请用一句话介绍你自己"}]
)
print(resp["result"])
关键点在于 messages 列表的格式,必须包含 role 和 content 字段。预期结果是终端输出一段流畅的自我介绍文本。

为了提升用户体验,我们可以开启流式输出(Streaming),让文字逐字显示,并调整温度参数 temperature 来控制创造性:
resp = chat_comp.do(
model="ernie-4.0-8k",
messages=[{"role": "user", "content": "写一首关于春天的诗"}],
temperature=0.8,
stream=True
)
for event in resp:
print(event["result"], end="", flush=True)
警告:开启 stream=True 后,返回对象变为迭代器,需使用循环处理,直接打印会导致错误。预期效果是诗句像打字机一样实时呈现在屏幕上。

想要成为专业玩家,可以尝试以下高级用法。首先是上下文记忆管理:在多轮对话中,务必将历史对话的 messages 列表完整传递给下一次请求,否则模型会“失忆”。其次是错误重试机制:网络波动可能导致 503 错误,建议编写装饰器实现指数退避重试策略。最后,利用 stop 参数可以自定义生成的停止符,精准控制输出长度,避免冗余内容,显著提升解析效率。
本文回顾了从密钥配置、基础调用到流式输出的核心步骤。建议您尝试结合本地文件读取功能,打造一个能分析文档的智能助手。如需深入探索,可查阅百度千帆官方文档中的微调指南与插件生态章节,持续精进您的 AI 开发技能。