续·给大侄子写个暑假作业开心【并不】网之从0开始获取题目数据

 2023-09-05 阅读 36 评论 0

摘要:经过层层努力还是失败了。。TMD实在是有懒得找格式统一的题目的网站了。 但是,段某人眉头一皱发现事情还可以更加复杂 于是百度下了一份word,标题是小学语文选择题100道,寻思,哎?还挺好。下载。文档如下: 中间发现了一些可执行的逻

经过层层努力还是失败了。。TMD实在是有懒得找格式统一的题目的网站了。
但是,段某人眉头一皱发现事情还可以更加复杂
于是百度下了一份word,标题是小学语文选择题100道,寻思,哎?还挺好。下载。文档如下:
在这里插入图片描述
中间发现了一些可执行的逻辑,于是使用notepad++的正则+替换手段改成:
在这里插入图片描述
格式大概就是
题目
选项A
选项B
选项C
选项D

然后使用python文件流

#函数3,读取搜索文件内容
def search_file():fp=open('searchfile.txt')i=0keyword=fp.readline()subject = []optionA = []optionB = []optionC = []optionD = []while keyword:nPos = keyword.find('\n')if nPos > -1:keyword = keyword[:-1]  # keyword.replace('\n','')if (i+4) % 5 == 0:optionA.append(keyword)if (i+3) % 5 == 0:optionB.append(keyword)if (i+2) % 5 == 0:optionC.append(keyword)if (i+1) % 5 == 0:optionD.append(keyword)if i%5==0:subject.append(keyword)i=i+1keyword = fp.readline()indexi = 0;for i in subject:print subject[indexi] + "\t" + optionA[indexi] + "\t" + optionB[indexi] + "\t" + optionC[indexi] + "\t" + optionD[indexi] + "\t"indexi = indexi+1#脚本入口
print('Start:')
search_file()
print('End!')

结果为:

1、下列字母的排列顺序错误的一组是(  B )	A、ABCDEF	B、JMMKLG	C、OPQRST	D、UVWXYZ	
2、下列大小形式互换完全正确的是(  B  )	A、T t  Wu	B、Y y  N n	C、G g  L I	D、Q p  R r	
3、读音节,注意声调,选出调号有错误的一组( C  )	A、水平如镜shuǐ píng rú jìng	B、桃李争妍táo lǐ zhēng yán	C、开卷有益kāi juǎn yǒu yì	D、完好无损wán hǎo wú sǔn	
4、下面字形和读音都正确的一组是( B  )	A、倾(qīng)盆大雨	B、磨(mò)房	C、一担(dàn)	D、眼眶(kuāng)	
5、“壮”这个字如果用音序查字法来查的话,应查(  A  )	A、Z	B、zh	C、zuàng	D、zhuàng	
6、按要求朗读,重音标示错误的一组是( A     )	A、今年我上五年级。(不是明年)	B、吴昊喜欢踢足球。(不讨厌踢足球)	C、南京是江苏省的省会(其它的城市不是)	D、这是我的语文书(不是别人的)	
7、下面读音错误的一组是( D   )	A、解(xiè)狐	B、解(jiě)落三秋叶	C、解(jiě)说员	D、押解(jiě)	
8、下面的字,书写笔画顺序不正确的一个是(  D   )	A、长	B、方	C、出	D、再	
9、下列词的字形错误的一组是( A   )	A、桥梁	B、漂流	C、资态	D、侮辱	
10、下列字形正确的一组是(  D  )	A、锻练	B、署假	C、遵敬	D、一丝不苟	
11、“释”这个字用部首查字法应查部首(D)	A、木	B、米	C、又	D、采	
12、“塞”在字典中有如下解释:①塞子;②边关,塞外;③重要的地方; ④把窟窿堵住。在“军事要塞”这个词中它应选( B   )	A、①	B、②	C、③	D、④	
13、下列字中跟“龄”字造字方法不一样的字是( B   )	A、堡	B、蝴	C、园	D、休	
14、下列每组中相同的两个字读音也相同的一组是(   A  )	A、怒发冲冠  千钧一发	B、发人深省 江苏省	C、落花流水丢三落四	D、挨打挨挨挤挤	

因为每一行都有\t所以Ctrl+C Ctrl+V扔进excel里:
在这里插入图片描述
copy第一列之后把答案提取出来,这里的代码没有保存。。 逻辑是取到括号里的里含有非空格的值然后提取出来存入excel第6列中
在这里插入图片描述
简单写个POI导入存入数据库
在这里插入图片描述
OK,现在数据也有了

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://808629.com/36.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 86后生记录生活 Inc. 保留所有权利。

底部版权信息