找回密码
 会员注册
查看: 39|回复: 0

用Python实现问卷星自动填写(超详细!!!)

[复制链接]

2

主题

0

回帖

7

积分

新手上路

积分
7
发表于 2024-9-12 20:08:58 | 显示全部楼层 |阅读模式
用Python实现问卷星自动填写(超详细!!!)前言一、配置环境1.1安装依赖1.2安装驱动二、实战处理2.1、引入库函数2.2、程序所需函数详解(1)自定义单选函数(2)自定义多选函数(3)自定义填空函数(4)自定义智能验证函数(5)自定义滑块验证函数(6)自定义屏幕滚动函数(7)主函数三、项目整体代码四、项目修改及扩展五、总结前言(Ps:废话部分可跳过)相信大家一定都有被问卷给折磨的时候,尤其去求别人填问卷的时候,如果是内向的小伙伴就一定很苦恼了,那么有没有一种工具可以帮助我们去自动填写问卷以达到问卷不求人的东西呢!答案是肯定的,我们都知道python是门很强大的语言,在自动化、人工智能、数据分析等领域有着举足轻重的作用,所以在这里我们选择用python来实现。一、配置环境1.1安装依赖①这里我们需要用到python的库函数——selenium库,这是帮助我们去爬取网页信息和处理网页的重要工具。也是我们本次实现程序所用到的库,直接在选择好的环境下执行pipinstallselenium。②我们还需要用到pyautogui库函数去模拟人手点击或拖拽来进行智能验证,也是在对应的环境执行pipinstallpyautogui。pipinstallseleniumpipinstallpyautogui121.2安装驱动执行本次程序是在谷歌浏览器下完成的,所以在此之前请下载谷歌浏览器(谷歌浏览器下载地址)。下好浏览器就可以去下载驱动了,在这之前我们还需做一步,打开已经安装好的谷歌浏览器,查看自己的浏览器版本。到这里我们就可以下载谷歌驱动了(Chrome驱动链接),点击进去找到对应的版本号,如果没有对应的版本号下载接近的一个即可,如下版本里面没有我的111.0.5563.65的版本,我们下载111.0.0.5563.64的即可(Ps:如果发现在后面打不开驱动出现错误,换一个驱动再试一下,因为这里有些人是要小一点的版本可以,有些人是大一点的版本可以)。下载好是一个压缩吧,解压完成后是一个.exe文件,可以放在任意的一个文件夹,只要能找到即可,我这里选择的是放在安装好的谷歌浏览器文件夹下。二、实战处理2.1、引入库函数这里我们引入所要用到的库函数及对应的包fromselenium.webdriver.common.byimportBy#没有selenium库的(请在所用的环境下pipinstallselenium)fromseleniumimportwebdriver#selenium库importrandom#用于产生随机数importtime#用于延时importpyautogui#用于模拟人手123452.2、程序所需函数详解(1)自定义单选函数当问卷中有单选就可以直接查询到问卷中的所有单选进行自动答题。defdanxuan(driver):#找到所有标签(定位问题)这里是单选dan=driver.find_elements_by_css_selector('#div1>div.ui-controlgroup.column1')foranswerindan:ans=answer.find_elements_by_css_selector('.ui-radio')#对应的绝对子标签random.choice(ans).click()#找到标签并点击time.sleep(random.randint(0,1))1234567(2)自定义多选函数寻找问卷中第几题是多选,就可自动去答多选中的题。defduoxuan(driver):#这里是多选题,找到所有多选的标签duo=driver.find_elements_by_css_selector('#div2>div.ui-controlgroup.column1')foranswerinduo:ans=answer.find_elements_by_css_selector('.ui-checkbox')#对应的绝对子标签#随机填几次foriinrange(1,7):#这里的7可以改成5,10,12random.choice(ans).click()#找到标签并点击time.sleep(random.randint(0,1))123456789(3)自定义填空函数需要自己去定义第几题是填空并填上自己想要填写的内容。如果要修改可这样改,例子:index里的数量一定要对应answer里的数量,index的名字可以跟answer不一样index=[“1”,“2”,“B”,“D”]answer={“1”:“python真的好用!”,“2”:“这个测试很成功!”,“B”:“填空题随机填写文本”,“D”:“随便填写!”}deftiankong(driver,num):#填空函数#这里是所需要问题的标签汇总,例如有四个要答的问题,下面的answer的ABC数量需要跟index里面的数量相等index=["A","B","C"]#自定义要回答的答案answer={"A":"python真的好用!","B":"这个测试很成功!","C":"填空题随机填写文本"}driver.find_element(by=By.CSS_SELECTOR,value=f'#q{num}')\.send_keys(answer.get(index[random.randint(0,len(index)-1)]))12345678(4)自定义智能验证函数当出现智能验证的时候,用自定义的这个函数可以帮我们解决。defrenzheng(driver):#智能验证,找到智能认证的标签bth=driver.find_element_by_css_selector('#layui-layer1>div.layui-layer-btn.layui-layer-btn->a.layui-layer-btn0')bth.click()#点击time.sleep(1)rectBottom=driver.find_element_by_css_selector('#rectBottom')#提交按钮rectBottom.click()#点击time.sleep(5)123456789(5)自定义滑块验证函数当填写问卷次数过多,这时智能验证之后还会出现滑块验证,这时候就需要滑块验证函数帮我们解决。defhuakuai():#当次数多了的时候就会出现滑块,这里是模拟人手解决滑块拖动pyautogui.moveTo(random.randint(494,496),791,0.2)#控制鼠标移动到x,y处,耗时0.2秒time.sleep(1)pyautogui.dragTo(random.randint(888,890),791,1)#让鼠标点击并拖拽到x,y处,耗时1秒time.sleep(1)pyautogui.click(random.randint(652,667),random.randint(793,795))#让鼠标点击x,y处time.sleep(1)pyautogui.moveTo(random.randint(494,496),791,0.2)#控制鼠标移动到x,y处,耗时0.2秒time.sleep(1)pyautogui.dragTo(random.randint(888,890),791,1)#让鼠标点击并拖拽到x,y处,耗时1秒1234567891011(6)自定义屏幕滚动函数当问卷中的题数量多的时候,由于答题过快,屏幕没有滑动,这时会被检测出是机器人,就会提交失败,所以我们还需要一个自定义屏幕滑动函数来帮我们解决屏幕滚动问题。defgundong(driver,distance):#用于屏幕滚动 #测算出最大的距离根据电脑屏幕分辨率而异,一般填写400到800,800是最大滑动距离js="varq=document.documentElement.scrollTop="+str(distance)driver.execute_script(js)time.sleep(0.5)12345(7)主函数defzonghe(times):foriinrange(0,times):#初始配置,地址url_survey='https://www.wjx.cn/vm/hiQpVeR.aspx'option=webdriver.ChromeOptions()option.add_experimental_option('excludeSwitches',['enable-automation'])option.add_experimental_option('useAutomationExtension',False)#本地下载的谷歌浏览器地址option.binary_location=r'D:\Goole_Local\Google\Chrome\Application\chrome.exe'#下载好的Chrome驱动的地址driver=webdriver.Chrome(r"D:\Goole_Local\Google\Chrome\Application\chromedriver.exe",options=option)driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument',{'source':'Object.defineProperty(navigator,"webdriver",{get)=>undefined})'})#启动要填写的地址driver.get(url_survey)danxuan(driver)#调用单选函数duoxuan(driver)#调用多选函数gundong(driver,600)#调用滚动屏幕函数,如果不需要则注释掉#调用填空题函数,这个3代表的意思是第三题是填空题,如果有其他填空题需要去完成再调用tiankong(driver,num)即可#举例:第八题也是填空题,这时我们加上tiankong(driver,8)tiankong(driver,3)#最后交卷点击提交#time.slee()函数是表示延时的意思,里面可以放固定值也可以放随机数,这里我放的是随机数。time.sleep(random.randint(0,1))driver.find_element_by_css_selector('#ctlNext').click()#找到提交的css并点击time.sleep(4)renzheng(driver)#智能认证函数调用huakuai()#滑块函数调用print('已经提交了{}次问卷'.format(int(i)+int(1)))time.sleep(4)driver.quit()#停止123456789101112131415161718192021222324252627282930313233三、项目整体代码fromselenium.webdriver.common.byimportBy#没有selenium库的(请在所用的环境下pipinstallselenium)fromseleniumimportwebdriver#selenium库importrandom#用于产生随机数importtime#用于延时importpyautogui#用于模拟人手defgundong(driver,distance):#延时+屏幕滚动js="varq=document.documentElement.scrollTop="+str(distance)#下拉像素(800是基于最顶端测算的距离)driver.execute_script(js)time.sleep(0.5)defdanxuan(driver):#找到所有标签(定位问题)这里是单选dan=driver.find_elements_by_css_selector('#div1>div.ui-controlgroup.column1')foranswerindan:ans=answer.find_elements_by_css_selector('.ui-radio')#对应的绝对子标签random.choice(ans).click()#找到标签并点击time.sleep(random.randint(0,1))defduoxuan(driver):#这里是多选题,找到所有多选的标签duo=driver.find_elements_by_css_selector('#div2>div.ui-controlgroup.column1')foranswerinduo:ans=answer.find_elements_by_css_selector('.ui-checkbox')#对应的绝对子标签#随机填几次foriinrange(1,7):#这里的7可以改成5,10,12random.choice(ans).click()#找到标签并点击time.sleep(random.randint(0,1))deftiankong(driver,num):#填空函数#这里是所需要问题的标签汇总,例如有四个要答的问题,下面的answer的ABC数量需要跟index里面的数量相等index=["A","B","C"]#自定义要回答的答案answer={"A":"python真的好用!","B":"这个测试很成功!","C":"填空题随机填写文本"}driver.find_element(by=By.CSS_SELECTOR,value=f'#q{num}')\.send_keys(answer.get(index[random.randint(0,len(index)-1)]))defrenzheng(driver):#智能验证,找到智能认证的标签bth=driver.find_element_by_css_selector('#layui-layer1>div.layui-layer-btn.layui-layer-btn->a.layui-layer-btn0')bth.click()#点击time.sleep(1)rectBottom=driver.find_element_by_css_selector('#rectBottom')#提交按钮rectBottom.click()#点击time.sleep(5)defhuakuai():#当次数多了的时候就会出现滑块,这里是模拟人手解决滑块拖动pyautogui.moveTo(random.randint(494,496),791,0.2)#控制鼠标移动到x,y处,耗时0.2秒time.sleep(1)pyautogui.dragTo(random.randint(888,890),791,1)#让鼠标点击并拖拽到x,y处,耗时1秒time.sleep(1)pyautogui.click(random.randint(652,667),random.randint(793,795))#让鼠标点击x,y处time.sleep(1)pyautogui.moveTo(random.randint(494,496),791,0.2)#控制鼠标移动到x,y处,耗时0.2秒time.sleep(1)pyautogui.dragTo(random.randint(888,890),791,1)#让鼠标点击并拖拽到x,y处,耗时1秒defzonghe(times):foriinrange(0,times):#初始配置,地址url_survey='https://www.wjx.cn/vm/hiQpVeR.aspx'option=webdriver.ChromeOptions()option.add_experimental_option('excludeSwitches',['enable-automation'])option.add_experimental_option('useAutomationExtension',False)#本地下载的谷歌浏览器地址option.binary_location=r'D:\Goole_Local\Google\Chrome\Application\chrome.exe'#下载好的Chrome驱动的地址driver=webdriver.Chrome(r"D:\Goole_Local\Google\Chrome\Application\chromedriver.exe",options=option)driver.execute_cdp_cmd('Page.addScriptToEvaluateOnNewDocument',{'source':'Object.defineProperty(navigator,"webdriver",{get)=>undefined})'})#启动要填写的地址driver.get(url_survey)danxuan(driver)#调用单选函数duoxuan(driver)#调用多选函数gundong(driver,600)#调用滚动屏幕函数,如果不需要则注释掉tiankong(driver,3)#调用填空题函数#最后交卷点击提交time.sleep(random.randint(0,1))driver.find_element_by_css_selector('#ctlNext').click()#找到提交的css并点击time.sleep(4)renzheng(driver)#智能认证函数调用huakuai()#滑块函数调用print('已经提交了{}次问卷'.format(int(i)+int(1)))time.sleep(4)driver.quit()#停止if__name__=="__main__":zonghe(2)#里面填写的数是表示要提交多少次问卷12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394四、项目修改及扩展如果上面的代码发现跟自己问卷星对不上且无法打开怎么办,别慌!这里教你怎么修改代码①这里我们用谷歌浏览器打开所需要填写的问卷星地址,然后用电脑上的F12打开开发者模式②这里我们可以选用快捷键CTRL+SHIFT+C启动元素检查或者点击我下图标注的地方来进行选择到题号③然后我们再查看选择题项的位置在哪里,然后我们就可以知道地方,再选择复制CSS地址就可以得到要修改的地方了④复制完之后我们可以看到得到的是什么,这里得到的就是单选题的大标签#div1>div.ui-controlgroup.column11再接着我们就可以看到各个小标签⑤然后我们就可以修改我们的代码了defdanxuan(driver): '''找到所有标签(定位问题)这里是单选,注意我们使用的是find.elements_by_CSS_selector()这样得到的是一个列表,里面包含了所有的选择题,将我们得到的大标签填入如下再修改我们所需要选择的小标签,注意小标签填写的时候前面要加.(点,如:.ui-radio)这是代表选择题的绝对路径,这样选择单选的时候就不会错误。'''dan=driver.find_elements_by_css_selector('#div1>div.ui-controlgroup.column1')foranswerindan:ans=answer.find_elements_by_css_selector('.ui-radio')#对应的绝对子标签random.choice(ans).click()#找到标签并点击time.sleep(random.randint(0,1))123456789101112多选题和填空题也是一样,看代码相信大家一定能看懂,这里就不过多展示了这里用的是CSS的方式,其实在项目中可以选择ID查找,XPATH路径去查找都可以,博客里面也有很多资料,都万变不离其宗,找到对应的标签即可。driver.find_element_by_xpath('//*[@id="div1"]/div[2]/div[1]')这是用XPATH得到的简单解释一下里面的值含义吧//*[@id="div1"]/div[2]/div[1]第一个div1表示的是第一题,第二个div[2]表示的是第二大部分是选择题,第三个div[1]表示的是选择第一个。那么你一定能看懂这个XPATH是什么意思//*[@id="div2"]/div[2]/div[2]这里表示的是第二题选择题第二个。123456五、总结python的selenium库是个很重要的网页处理函数库,在处理动态网页上扮演者很重要的角色,一般我们所看到的网页都可以用里面对应方法来完成,只要理解到标签的含义,其实做这类的题是很简单的,这里就是想起前面那段时间填写问卷的时候,所以有感写下这篇文章和方法,但是实际上如果是去比赛的做市场调研之类的,还是不要用这种方式,毕竟真人的感觉选择和机器的随机选择出入还是很大的,在信度分析和效度分析很可能就会垮掉,创作不易,望各位看官给赞再走!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-27 01:29 , Processed in 1.337337 second(s), 25 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表