手机浏览器扫描二维码访问
作为一名合格的科研工作者,谢与非首先开始做文献收集工作。
Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。
不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。
然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。
接着呢,就是科研狗们最喜欢的收集数据阶段。
谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。
于是她——开始看小说了?
不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。
但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。
开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。
通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。
根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。
根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。
表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。
于是画起了横轴和纵轴。
除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。
什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。
画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。
小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)
:||
迟迟动心 第101号玩偶 纯情女配被迫当霸总 万人迷黑月光决定死遁 这一次,我选反派[重生] 欲拒还迎后男主精分了 御厨大人她有新派料理[美食] 沉橘 长官,你虫设崩了[虫族] 人间很值得 四时不及你 [综英美] 跟着红桶学做人 举家穿越到五零 折骨 绿茶女配的前男友们 星际第一符籙机甲师 花田喜事 三十七场日落 七十年代创业忙 瑞雪临
...
钟文丽(女)的征婚启事说凡是来应征的每人奖励五千块钱,经过各种媒体的宣传立刻传遍大江南北,应征者络绎不绝,在这些应征人里,竟然有曾经抛弃过钟文丽的陆小康,经过错综复杂扑朔迷离的曲折故事,终于有情人成为眷属...
出轨的男人,就像是掉在屎上的钱,丢了可惜,捡了恶心。可我还是捡起来了,却把自己推进了无尽的噩梦里。...
一个高二男学渣在未来时空系统帮助下,一步步成为学霸,大神作家,神秘网红,神秘女明星,最终成为神秘天后巨星的日常故事。作者有百万字小说重生女棋神信誉作保,每日两更,请放心收藏。...
突然有一天,美女师姐裸死在了少年的床头,少年的人生风中凌乱了。背井离乡,混迹在天下最阴毒的化盅宗,拼搏在天下最淫乱的合欢宗,常震注定会成为让天下仙妖闻风色变的一代蛊皇!本文化异兽,也化形,略邪恶。卫道士莫入,未满十八岁禁止阅读,谢谢合作!十年妹控无人问,一朝御姐天下闻。小虎的书,看过的书友都知道,节操满满,没有槽点!...
功法和武技修炼的七大境界入门初成小成登堂大成圆满意境。修炼越往精深,境界提升越加艰难,但威力也越发强大。低级功法和武技,若修炼到高境界,甚至能超越高级功法和武技!武道天赋资质低劣的宁冲,一次意外,神奇获得了一种胜过妖孽悟性的感觉。从此,只需跟着感觉走,同样的功法和武技,别的武修还再为入门而苦恼的时候,宁冲已经在冲击最高的意境境界别的武修从来不屑一顾的垃圾武技,却在宁冲手中爆发出强悍威力,轻松完虐其他武修的高级武技。于是不鸣则已,一鸣惊人!欺辱百倍奉还,天才一一踩倒!要以威名震四方,誓以神武惊天人!这天地,绝不是我之武道的极限!...