找回密码
 会员注册
查看: 21|回复: 0

使用Python制作一个属于自己的AI搜索引擎

[复制链接]

2万

主题

0

回帖

6万

积分

超级版主

积分
68585
发表于 2024-9-10 20:21:26 | 显示全部楼层 |阅读模式
1.使用到技术OpenAIKEYSerperKEYBingSearch2.原理解析使用Google和Bing的搜搜结果交由OpenAI处理并给出回答。3.代码实现importrequestsfromlxmlimportetreeimportosfromopenaiimportOpenAI#从环境变量中加载API密钥os.environ["OPENAI_API_KEY"]="sk-xxxx-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"os.environ["SERPER_API_KEY"]="xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"#确保在执行代码前已经设置了环境变量OPENAI_API_KEY=os.getenv("OPENAI_API_KEY")SERPER_API_KEY=os.getenv("SERPER_API_KEY")defsearch_bing(query):headers={'Referer':'https://www.bing.com/','User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/127.0.0.0Safari/537.36',}params={'q':query,'mkt':'zh-CN'}response=requests.get('https://www.bing.com/search',params=params,headers=headers)html=etree.HTML(response.text)li_list=html.xpath("//li[@class='b_algo']")result=[]forindexinrange(len(li_list)):title=";".join(li_list[index].xpath("./h2/a/text()"))link=li_list[index].xpath("./h2/a/@href")[0]snippet=";".join(li_list[index].xpath("./div/p/text()"))position=indexprint(title,link,snippet,position)result.append({'title':title,'link':link,'snippet':snippet,'position':position,})returnresultdefsearch_serper(query):"""使用SerperAPI进行搜索并返回结果。"""url="https://google.serper.dev/search"headers={"X-API-KEY":SERPER_API_KEY,"Content-Type":"application/json",}params={'q':query,'gl':"cn",'hl':"zh-cn",}try:response=requests.post(url,headers=headers,json=params)response.raise_for_status()#检查HTTP请求状态serper_data=response.json()ifnotserper_data:return"无法获取搜索结果",[]google_context=serper_data.get('organic',[])google_other=serper_data.get('relatedSearches',[])returngoogle_context,google_otherexceptrequests.RequestExceptionase:print(f"请求失败:{e}")returnNonedefsearch_openai(query,context):"""利用OpenAIAPI回答问题并引用相关上下文,并使用流的方式输出。"""context_template=("你是GinLynn构建的大型语言AI助手。给你一个用户问题,请正确、简洁、准确的讲述这个问题的答案。""你会得到一组与问题相关的上下文,其中每个对象都是一个json字符串,""'snippet'字段表示片段,'title'字段表示,'link'字段表示链接,'position'字段表示位置。""请使用这些上下文并在每个句子的末尾引用上下文(如果适用)。""你的答案必须是正确、准确的,由专家以公正和专业的语气撰写。请限制为2048token。""不要给出任何与问题无关的信息,也不要重复。如果给定的上下文没有提供足够的信息,""那么在相关主题后面加上“informationismissingon”。请以[position]的格式注明出处和参考编号。""以下是一组上下文:")client=OpenAI(api_key=OPENAI_API_KEY)try:completion=client.chat.completions.create(model="gpt-4o",messages=[{"role":"system","content":context_template+context},{"role":"user","content":query}],stream=True#启用流式响应)#逐条打印流式输出的结果forchunkincompletion:ifchunk.choices[0].delta.contentisnotNone:print(chunk.choices[0].delta.content,end="")print()#输出换行return"完成输出"exceptExceptionase:print(f"OpenAIAPIrequestfailed:{e}")return"无法完成请求",[]if__name__=='__main__':query=input("请输入查询:")ifquery.strip()=="":query="最新俄乌局势信息"print("正在搜索...")serper_context,other_queries=search_serper(query)bing_context=search_bing(query)context=[]ifbing_context:context.extend(bing_context)ifserper_context:#为Serper上下文的每个条目重置position值,以防止重复forindex,iteminenumerate(serper_context,start=len(bing_context)):item['position']=index#从当前Bing结果的数量开始context.extend(serper_context)print("搜索结果:",context)search_openai(query,str(context))ifother_queries:print("相关搜索:",other_queries)1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191201211221231241251261271281291301311321334.运行结果
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2025-1-5 09:27 , Processed in 0.444740 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表