多彩大学生网,大学生三下乡投稿平台
 

后疫情时代的国内网络社会状况分析

发布时间:2023-08-16 关注: 一键复制网址
摘要:当今社会中,网络社区愈发占据着更多的社交环境,成为许多人日常生活不可分割的部分,但与此同时,网络社区环境随着近年来疫情影响导致的大量人员流入开始分化与变质。为得到后疫情时期各大网络社区的文化属性变化与差异,了解不同条件下的个体对不同网络社区的需求程度,文章结合现有的部分研究理论,通过Python爬虫与词频分析、问卷调查与SPSS统计、线上线下非正式采访,从六大社区与随机人群两个方面获取后疫情时代的网络社会特征,进行进一步梳理研究,提出应当注重网络虚拟社区的分析研究,把握网络社区属性与风气导向。
关键词:网络社区;词频分析;问卷调查;网络属性;

一、绪论
(一)分析背景与现状
1,社会背景浅析
随着现代社会科技不断发展,互联网早已成为人民生活中必不可分的部分,其已经融入进每一个人生活的方方面面,从饮食出行到娱乐社交,网络社会已经是当代国人日月相处、很难避开的环境。特别是自2020年新冠疫情与其所带来的各类封控管理开始,以实体店、公共场所为代表的各类线下服务与生活以肉眼可见的速度加速衰弱,而与之相对的,各种网店、网站、网络娱乐、社交平台等各种线上生活日益增长,并有着很客观的增长速度(具体网络社会数据近年变化在下述)。而到了当今2023年后疫情时代,网络社会、线上生活仍在继续增长,以符合当代时代与国家发展需要。但经历了疫情时期,在后疫情时代的网络社会面临着各种问题与各种新现象。
2,政策背景浅析
我国对于互联网的相关管理与政策从上个世纪90年代就初现雏形,并在21世纪前十几年经历了一定程度的发展。但这个时期的互联网仍处于野蛮生长的阶段,也没有太多和全面的了解,相关政策也多是着眼于局部与最核心的一些方面。以这二十余年的国家监管为代表,主要可以分成三个阶段:一、监管的引入和奠基阶段(1994年-1999年);二、监管体系全面建立阶段(2000年-2007年);三、监管优化与扩展阶段(2008年-2012年)。这三个阶段也鲜明地表现了我国互联网的前二十余年变化,直到2013年左右开始的新阶段。2013年起,互联网产业革命全面爆发,国外也环绕互联网出现了各类事件,这一切都使得国内的互联网社会因政策的引领进入了新阶段。也是同年,中央网信办开始开展治理网络构成清朗网络空间行动,定基了至今每年固定的“净网行动”。再到2017年,围绕十九大新的政策导向,国家针对网络社区制定了以《互联网论坛社区服务管理规定》为主的多项管理条案,并进一步推动网络管理与净网行动。最后来到经历了疫情网络社会爆炸发展的后疫情时代,关于后疫情时代的各种网络社会特征与状况,其政策内涵主要以疫情时代与二十大报告为导向。
(二)分析目的及意义
当代社会中,网络社会是其极为重要的组成部分,网络社会因其特有的开放性、海量性、时效性与无距离感(全球性)而更适应当今时代与社会交流,故此而获得了极大程度的发展。当今时代,只有牢牢把握住网络社会上的话语权与网络舆论,才能发出更大的声音、更大程度的站到优势地位。
以国家高校为例,当下网络社会充满着各类抹黑舆论与极端评价,多数高校没有把握网络机遇、网络话语权,各类言论在网络社会上迅速传播,甚至传到了现实生活中,这对各大高校的社会形象、社会评价、甚至是学校利益都产生了严重影响。
而再说当下后疫情时代,经历了疫情时代与科技发展诱导的互联网各项使用高速增长,当今网络社会也面临着快速发展背后的各种问题与矛盾,随着时间推移与社会发展,这类问题与矛盾也愈加严重,一定程度上影响着人民的身心健康。把握网络社会氛围、抓住网络社会话语权,这对于当下社会的每个个人、集体、公司、甚至政府国家都具有极为重要的意义。
(三)相关概念阐述
1,网络社会
“网络社会”一词最开始指信息时代的社会,是作为现实空间的一种新社会结构形态的“网络社会”,首次出现于学者狄杰克(Jan van Dijk)于1991年出版的书籍《De Netwerkmaatschappij》。但随着时代发展,“网络社会”一词的所指涵义也发生变化。在当今,我们拟可将“网络社会”的涵义归纳为两大类:作为现实空间一种新社会结构形态的网络社会(Network society),与基于互联网架构的电脑网络空间的网络社会(Cyber society),也可称之为虚拟社会。
在国内学术界中,网络社会(Cyber society)比起网络社会(Network society)的研究更为热门。它是一种虚拟的社会,存在于Internet通过网络技术等模拟现实情境所构成的一个沟通信息的虚拟空间(virtual space)或电子空间(cyber space)。如今,这个空间已经成为了人类交往的一种虚拟网络环境,且就其所产生的广泛社会关系而言,它也是一种社会形式。本文所研究的网络社会即指网络社会(Cyber society)。
2,网络社区(网上社区/虚拟社区)
“网络社区”的概念最开始由学者霍华德·瑞恩高德(Howard Rheingold)于1993年提出,并将其定义为“一群通过计算机公告栏和网络交谈和交流思想、可能相互见面也可能不见面的人, 经常在电脑空间里相遇而形成的文化集合”。而随着时间推移,“网络社区”的概念也被不同学者从不同角度进行阐述,尽管意见不大相同,但学术界对于“网络社区”的普遍认识一致,即“互联网环境下一群相互交流的个体的集合”,如各种主题论坛、博客、社群等。虚拟社区帮助人们在网络上构建了超越时间和空间的虚拟生活空间,使用户可以远程参与学习和娱乐。
(四)主要研究内容
本次调查分析主要围绕后疫情时代的国内网络社会进行,主要基于武汉图夫科技有限公司的开源程序文字云与SPSS软件的数据分析进行研究。本次调查采用点面结合的方法,一方面,针对选定的六大各具特色的网络社区为对象开展调研(六大社区分别为:抖音、微博、bilibili、知乎、贴吧、小红书);另一方面,进行大量的用户数据意愿收集,进行数据统计。结合Python爬虫的文字云词频分析与结合问卷收集进行的SPSS数据分析即分别用于各自方面。与此同时,还进行部分线下官方调研采访,与一些社区、公司对接,进行相关询问调查,并进行结论交流。
主要研究内容具体包括:
(1)根据公共数据、社区年报等正规消息源大量查找得到六大社区基本信息。主要以六大社区为样例,进行疫情时代至后疫情时代四五年间的社区用户数、热度等状况查找,以便进行初步分析,得到各社区的特征要素并备用。另一方面,查找六大社区的男女比例、用户年龄分布,这对后续研究也具有重要作用,是进行全面分析的基础。
(2)基于开源工具文字云进行以六大社区为对象的社区特征词提取与词频分析。通过爬取六大社区网站的各类文本作为分析库,将得到的原始文本通过文字云分析词频,最后输出词云。但值得注意的是,文字云并不能完美进行有效关键词的提取分析,所以需要进行后期人力筛选与返回本文分析,以便得到真正需要的社区特征词集。
(3)基于SPSS软件进行问卷收集数据统计分析。针对所要分析的社区对象,创造问卷收集,进行使用意愿等方面统计,并收集部分完全匿名性的看法评论。SPSS对于所收集到的问卷信息,进行包括但不限于分类汇总、样本t检验、方差分析等方面的数据处理,以最后分析得到部分具有参考意义的结论。
(4)通过网络上与线下进行相关专业人士采访,总结相关更具有针对性的看法。与社区网络监管员、网络状况分析员,网络社会公司的网络管理员、工作人士等进行交流、非正式采访,得到相关更具有专业意义的看法,以用来对本次调查进行另一层面的鉴定与指导。同时查找政府疫情与后疫情时代的网络社会管理政策,进行更具有权威性的理论指导。

 二、理论基础
(一)Python爬虫
互联网上的所有信息资源都是通过其统一的且在网上的地址URL(统一资源定位符,即网址)作为相关标志放在服务器上,而对于我们所需要网址的访问,是通过超文本传输协议(HTTP)来实现。HTTP是一个简单的“请求-响应”模式的无状态应用层协议,它通常运行在TCP之上,指定了客户端可能发送给服务器什么样的消息,以及得到什么样的响应。
HTTP是基于“客户-服务器”模式且面向连接的,典型的访问网址基本过程如图所示:

互联网上大量资源节点相连在一起,如同一张大大的蜘蛛网。网络爬虫(Crawler)又称网络蜘蛛(Spider),这也是指其就像蜘蛛一样,可以在网上沿着URL线路爬行、可以按照事先制定的规则(爬虫算法)自动地浏览并获取网页信息的计算机程序。
网络爬虫的常用功能有:搜索引擎、爬取图片、爬取网站用户公开信息、爬取多站文本内容等等等等。爬虫的出现,可以在一定程度上代替手工访问网页,使人工访问互联网的操作自动化,以更高效地利用好互联网中的有价值信息。
但注意,网络爬虫需要注意合法性问题。《中华人民共和国民法典》第一千零三十三条明确规定了对个人信息的网络隐私权,在网站上爬取涉及个人隐私的数据是不允许的,更不能将爬取的数据进行商业用途、违反法律规定。本文对于各大社交网站上用户发布、评论的内容进行特征分析,仅用于本实践项目的调研报告,未涉及商业用途,也未涉及个人隐私等受法律保护的信息。
(二)词频分析
在信息爆炸的时代,对于互联网上的海量数据,我们需要从其中快速找到自己需要的有价值信息,词频分析就是这样一种有效的工具。词频分析(Word Frequency Analysis)是对文本数据中重要词汇出现的次数进行统计与分析,是文本挖掘的重要手段。它的基本原理是通过词出现的频次多少的变化,来确定热点及其变化趋势。
词频分析基于自然语言处理技术,运用算法对文本进行分析处理,常用的词频分析相关技术有Jieba。其分词主要是基于统计词典,构造一个前缀词典;然后利用前缀词典对输入句子进行切分,得到所有的切分可能,根据切分位置,构造一个DAG(有向无环图);通过动态规划算法,计算得到最大概率路径,也就得到了最终的切分形式。
具体而言,用Jieba进行分词与后续进行词频统计包括以下几步:
(1)读取文本文件。
(2)对文件中的文本进行预处理。
(3)通过Jieba库的函数定义“用户词典”与“动态调整词典”。
(4)使用Jieba的搜索引擎模式处理文本,进行分词。
(5)运用collections库的函数进行词频统计。
(6)基于词性输出特征词集。
(7)对输出词集进行人工修正。
而对于词频分析的统计算法有多种,其中比较常用的是基于词频的TF-IDF算法与基于词义的TextRank算法,Jieba就是分别基于TF-IDF和TextRank模型抽取关键词。
TF-IDF算法:一种以词袋的形式获取关键词的文本挖掘算法。其会评估一个词语对整个文本的重要程度,即某个词对该文本的重要程度以及其在文本中出现的次数成正比例、与文本库中包含这个词语的文本频率成反比例关系。该算法主要包括两个指标:TF值与IDF值。TF值表示一个词在文本中的出现频率,IDF值表示这个词在整个文本库中的出现频率。通过将这两个指标相乘,就可以得到一个单词在文本中的重要程度。
TextRank算法:一种基于图论思想的文本关键字提取算法。思想来自于Google公司的PageRank算法。它根据词共现的方法把文本中的词语或句子看作图中的节点,根据词句的相关性确定带权边,从而将文本转化为图,最后利用PageRank算法对文本中的节点排序,从而获得关键词。
这里只是对词频分析进行简单介绍,本文选择直接运用武汉图夫科技有限公司的开源程序文字云进行分析,故而在这里仅作为简单了解。对Jieba库的运用,或是对于TF-IDF算法和TextRank算法等文本分析算法的研究,可作为后续对网络社会研究更深入的分析方法。

三、具体调研
(一)社区属性特征词提取
对于六大社区的特征词分析与属性提取,主要分为以下几步:
(1)大致了解社区结构,确定原始文本来源。
(2)按照规划爬取、储存社区原始文本。
(3)通过文字云进行原始文本的特征词初步分析。
(4)对初步的词频分析结果进行二次人工整理。
(5)输出最终得到的词频分析结果,得到社区属性特征词集。
关于原始文本来源的确定,六大社区方式不尽相同,但均是围绕热点、高讨论度、考虑平均选取,最大程度减缓特定话题的影响趋势。六大社区的原始文本选取源可以分为三类:抖音来自于视频评论区,B站来自于视频评论区与弹幕两个方面;贴吧与小红书来自于推文评论区;知乎与微博来自于话题下推文与评论区两个方面。
这里以B站为例,进行原始文本的来源确定:
对于任意网络社区,都要考虑到当下普遍存在的用户个性化推荐,故而考虑到最纯粹的进行视频下评论区选取,这里采用不选择兴趣偏好的新注册账号。针对B站而言,对象即选择纯净账号下的综合热门、结合排行榜全站与其他分类共计五十个视频,这些视频的评论区就被选择为原始文本来源。
确定原始文本来源后,基于requests与bs4模块运用Python爬虫获取视频评论区,按热度排行的前二百条一级评论与最新一批视频弹幕,并将其均储存在txt文件里备用,这里以热门区视频“【泛式/剧情MAD】哥哥的女朋友,只能由我来选......”(BV1sW4y1Z7pn)为例。
对于网页爬虫分为静态网页与动态网页,而经检验,对六大社区原始文本来源的网页均为动态网页。对于动态网页,首先进行原始文本对象的位置查找,对于B站评论区的一级评论位置查找即如图所示:
找到原始文本的对应位置,并获取请求头,在pycharm里结合requests与bs4库,进行相关代码编写,并将获取结果储存在“评论.txt”中即可。
相关代码如下:

对弹幕的提取操作同理。五十个目标视频评论区重复操作完成后,即可得到B站社区的原始文本。
对于得到的社区原始文本,我们运用文字云将其录入,进行初步的词频分析,这里仍以上一步的视频为对象,所得到的词频分析结果相对粗糙,如占据多数的有涉及视频主内容的“赤音”、“露比”与不具有任何代表性的日常生活用语“喜欢”——这些问题在大量原始文本的积累下仍会存在。故针对这些情况,需要进行二次人工整理,将这些不符要求的词汇剔除,获得最终的特征词集。
对于“【泛式/剧情MAD】哥哥的女朋友,只能由我来选......”此样例视频,以其最终的特征词集生成的词云如图所示:

注意:这其中会出现如“每天一遍”与“再来亿遍”此类意义近似相同或完全相同的词汇,在最终分析时,会将此类词汇在词集中归一。也会出现像是“首页”、“通知书”这种明显可以合成的词汇,但文字云在进行初步词频分析时会将这种组合词分开,这种情况下两个可组成词汇的词频会相对接近。此时经过鉴别,就可以在二次人工整理时将其按照社区的可能属性,将其重新整合。
(二)调查问卷创造与收集
关于随机人群的调查问卷填写收集,主要可以分为以下几步:
(1)对各种条件人群进行粗略的随机抽样采访。
(2)围绕采访所得的需求与看法,讨论创造初始问卷。
(3)随机选取部分对象进行初步填写。
(4)依据初步填写问题,修改问卷得到最终版问卷。
(5)对随机人群广泛投放,收集问卷填写结果。
(6)将问卷结果转化成表格,以便后续分析。
在创造问卷之前,需要先去大致认知基本情况,确定问卷收集与分析的目的:输出后疫情时期各类人群对于网络社会的依赖情况,以及对于各大社区的需求与评价信息。以所需得到的最终目的、国内后疫情时期的政策指引为导向,参考当下现有的研究分析情况,整合出采访内容的大致框架,进行对各种条件人群的随机抽样采访。
对于本文项目所研究的对象而言,第一步进行的随机抽样采访要具有协调性与普适性。这也要求着对于采访对象的选取要涵纳各类人群,主要以年龄为主要区分,除此之外也要考虑一定的地域经济因素。考虑到后疫情时期互联网与以抖音快手为主的网络社区用户类型更加丰富,对于年龄的分层主要分为:10岁以下;10至24岁;25至40岁;41至60岁;60岁以上。而对于地域经济等其他因素仅保证选取的对象来源于不同水平即可。
初始问卷的创造主要依据最初框架与采访内容进行,并要综合考虑后疫情时期的实际情况以及国家相关政策指引。在初始问卷完成后进行测试修改,得到最终版问卷。
最终版问卷主要包括三个部分:基本信息(确定用户所属人群)、针对社区的反馈(与本文另一部分得到的社区属性相互检验,从客观与主观角度多方面得到更具有普适性的社区模型)、对于总体网络社会的反馈(用于最终的整体分析)。具体内容主要包括社区内容(作品质量、评论素质)与社区氛围(平台运营、用户素质)两方面。
最终版问卷的流程图如下所示:

对于问卷目标人群投放方面,与第一步类似,问卷的人群随机投放要注意协调性与普适性。这也要求问卷投放目标要进行预先确定,对各年龄层的投放以青少年群体居多。值得注意的是,投放问卷可选择在QQ、微信等与六大社区(抖音、微博、bilibili、知乎、贴吧、小红书)呈弱相关或无相关的网络平台进行,对于例如快手等与六大社区有较强相关性的网络平台不要选择投放,否则会导致问卷结果损失一部分普适性。
(三)线上线下相关人士采访
此方面主要体现在对相关专业人士的非正式采访,从多个角度,线上线下、网络现实,多维得到一定的有参考价值信息。考虑到可采访对象受限、可选渠道少等现实因素,本文调研项目采访对象主要有企业网络社区管理员与社区网格员。
对于企业网络社区管理员的采访采用完全匿名的非正式采访形式,线上与可联系的专业人士对接,进行部分话题采访。采访内容包括但不限于:(1)在日常平台运营中发布内容的潜在趋势、对平台的话题舆论管控。(2)平台日常的举报、投诉情况受理与过审情况评估。(3)平台日常维护运营的人工管控与程序自动管控的对应比重。(4)对平台的用户分析与环境评估。(5)对当下网络社会从工作人士角度的部分看法。
对于社区网格员等相关社区工作人员的采访则侧重于网络社会对人民现实生活的影响分析。采访内容包括但不限于:(1)后疫情时期来临后居民的网络生活状况。(2)日常社区管理下关于网络社会的普遍问题。(3)日常的居民涉及网络社区的相关事件与对策。(4)实际社区中关于网络生活的困难与需求。(5)社区对于网络舆情的相关引导与问题化解。
此部分的采访结果会进行有选择性的精炼总结,并进行与当下相关政策的交互看待,得到部分有一定高参考价值的结果作为参照指引。

四、调查结果分析
(一)六大网络社区方面
(1)基本信息分析
对于六大社区,我们首先进行社区的基本信息分析。
以各网络社区官方与公司年报等为信息源,我们可以得到各社区19年以来疫情与后疫情时期的历年平均MAU(月活跃用户数),其可作为各社区热度分析的重要参照指标:

我国网络社会从2013年互联网革命爆发后就开始高速增长,当时的主要网络社区有天涯、虎扑、贴吧等,而一直发展到2020年后的疫情时期,网络社会又开始新一轮丰富发展与变化。由图可看出,以抖音为代表的短视频社区与以微博为代表的名人主流社区位居高位,以当今社会潮文化、亚文化、年轻人为主的bilibili与小红书居于中间层次,而贴吧、知乎等经典网络社区处于逐渐衰弱或趋于稳定的状态,这与近年来国内整体网络社会的普及度增长形成了一定的对照。
值得注意的是,本文展示的历年平均MAU源自于官方数据,其中为吸引投资等目的,不否定存在数据有虚高的可能。但对于大致的对照与趋势,分析当下网络社会的概况而言,其实影响不大。
此外,我们还对各社区性别比例进行分析:

从图中可看出,贴吧与知乎用户以男性居多,而微博与小红书用户以女性居多,抖音与bilibili男女性别比例无明显差别(其差别主要体现在年龄分布上,抖音用户的年龄分布均匀,而bilibili用户多以10-18岁、18-24岁的青少年为主)。
联系上图,不难发现不同社区性别比例与平均月活可能存在一定关系,对此可以进行单因素方差分析。假设不同社区性别比例对于社区历年平均月活无显著差异,通过计算统计量的观测值与概率p值,可以返回概率p值小于显著性水平α的结果,拒绝原假设,得出不同社区性别比例与平均月活存在较强相关性,进一步可以说明,在一定程度上女性用户对社区月活起到更强的促进作用。
而对于各社区的年龄分布状况,没有从官方数据中发掘到同类型结果,各社区的年龄划分均不相同,故在此只进行大致说明:
抖音:年龄分布相对均匀,整体分层的用户数呈稍微的随年龄增大而减少。24以下、25-24岁、35-54岁的用户数均超过2.4亿,24以下超过4亿,55岁以上也有5千万以上。
微博:年龄分布多集中在青年成年人群。用户以18-30岁为主,占到总体的70%以上。值得注意的是,16-17岁的用户占比高于41岁以上占比。
Bilibili:年龄分布多集中在青少年。24岁以下占比60%以上。
知乎:年龄分布类似微博。20-30岁占比70%。其他年龄段分布较为平均。
贴吧:年龄分布也集中在青年成年人群。18岁以下占比仅有2.9%,为六大社区最低,18-34岁占比85%左右。
小红书:年龄分布类同微博。18-35岁占比超70%,其中18-23岁用户占比最高。
综上所述,六大社区的年龄分布可大致分为三类:均匀分布(抖音)、青年成年为主(微博、知乎、贴吧、小红书)、青少年为主(bilibili)。但注意,各社区青少年占比都明显少于现有文献分析状况,且某些社区缺少18岁/16岁以下用户数据,所以年龄分布的结果只进行大致分类,并只在分析社区属性时进行一定参考。
(2)社区属性分析
对于社区属性的分析,本文主要参照已提取得到的社区属性特征词集:

依照各社区所提取的属性特征词集,结合上述已知的社区性别比例与年龄分布,可大致分析各社区的社区属性:
抖音:能明显发现抖音的属性特征词集与网络社会的整体流行词契合度最高,这其中存在部分以抖音为代表的短视频网络社区高热度、高流量的原因。一定程度上,抖音等短视频平台的高热度、高流量影响着整体网络社会的语言习惯与舆论风气走向。抖音特征词多偏日常、生活与流行梗词,这也体现着抖音的社区内容,高生活化、高日常也有短视频碎片化的影响因素。其社区属性可以概括为:碎片化、生活化、高舆论导向。
微博:与抖音不同,微博虽具有着稍逊抖音的高热度,但其社区属性特征词集与网络社会的整体流行词契合度不高,微博对社区外的影响输出相对较弱。其特征词多属于青少年偏女性群体,以青春、爱情、明星等流行文化契合度较高,这可能也与微博的营销策略具有一定关系。对微博属性的特征词集分析,也证明了女性用户对社区月活热度在一定程度上起到更强的促进作用的观点。其社区属性可以概括为:明星化、女性化、青春气息。
bilibili:B站的特征词集的典型特征是具有很强的年轻一代的感觉,这也与B站自己的宣发保持高契合度,即致力表现年轻一代对B站的热爱。B站的特征词多属于青少年群体,且相对微博更年轻化,造词方面也多偏向缩略简写,特征词的情感倾向相对积极轻松,体现着一种更新的青春活力。其社区属性可以概括为:亚文化、新潮化、年轻一代。
知乎:知乎的特征词集也具有极为明显的特色,其可以大致概括为多问答咨询,这也与知乎的社区结构密不可分。知乎特征词几乎都与“问答”脱不开关系,在其他社区的低频词如“评论区”、“如果”等在知乎中出现频率极高,社区生态也多以问题的提问与回答以主要内容。其社区属性可以概括为:内容化、知识化、问答模式。
贴吧:贴吧的特征词与知乎都较偏向男性群体,体现着一定程度上男性群体比女性群体相对弱生活化、或者说对社区热度的促进作用相对女性较弱。但区分于知乎的内容化,贴吧的特征词集更偏向于情绪输出。由贴吧的特征词集可明显看出,大多特征词都多体现在重情绪化与矛盾摩擦。与当今网络社会风气进行对比,会发现当下网络社会在疫情时期出现一种新兴的抽象文化,这种网络文化与贴吧文化风气契合度很高。其社区属性可以概括为:情绪化、攻击性、抽象文化。
小红书:小红书的特征词集与微博有一定的重合度,大体多偏向于女性群体。但与微博不同的是,小红书的特征词集虽也体现着生活、青春气息,但比起微博的明星化则更偏向于普遍人群化,从两社区特征词“演唱会”、“抄作业”、“安利”等就能体现较为明显的区别。小红书的特征词集体现着青少年女性群体一定的日常生活享受需要,但不可忽视的是,小红书的特征词集从另一方面也可以看出其的内容化、一定的知识分享属性。其社区属性可以概括为:精细化、时尚化、工具属性。
综上所述,可发现六大社区各自的主流属性有一定差别,但也具有不同程度的相关性。但值得注意的是,上述分析是通过文本处理、词频分析得到的社区属性特征词集而来,客观条件的驱动程度较强。故对于各社区具体属性可能略失之偏颇,需要集合下一块的问卷分析进行综合研究。
(二)随机人群问卷方面
对于随机问卷方面的分析,主要目的是获取从人群角度进行的主观研究。本文将所收集到的410份问卷回答制成图表,分成选择评分方面与可选则性回答方面进行分析。
选择评分等可量化的数据方面,我们进行SPSS数据处理,其涉及的数据内容包括基本信息(性别、年龄),社区评价(使用时长、满意度、打分),与网络社会总评价。
首先我们进行性别比例与年龄分布的统计,以保证所得数据的普适性,不会失之偏颇。

问卷的性别比例接近1:1,年龄组成以10-24岁青少年占超过50%的部分。关于年龄组成是否类似正态分布,非参检验的S-W检验、K-S检验结果均说明其不符合正态分布,从直方图中我们也可看出年龄组成主要以10至24岁青少年与25-40岁成年人居多。此结果也与各社区的基本年龄组成相近,可说明问卷具有一定程度的代表性。
在往下分析前,我们进行一个新变量“网络社会的陷入程度”的定义,其主要用于分析网络社区的整体使用与所需要分析因素如网络社会评价的关系。其定义式为:网络社会陷入程度=抖音时长+微博时长+bilibili时长+知乎时长+贴吧时长+小红书时长。对于“陷入程度”,为更可观进行统计分析,我们再对其按照陷入程度进行数据分组,分为六类不同组别,定义为“陷入程度新”。根据频数分析,可知其均值为2.49、众数为2、最小值与最大值分别为1和6,表示多数用户对网络社区的使用总定量数值可达到8-13。这个指标也可以表现出用户对于网络社区的依赖程度或称粘性,表明多数网络社会用户对于社区忠实度较高,对于网络社会具有较深的依赖性。
关于各个社区进行的具体分析,对各社区参数(社区评分)与网络社会总参数(陷入程度、评分)进行分类汇总,得到各社区在问卷调查中的使用占比、作品质量、环境氛围、总得分,以及各社区是否使用的人群的陷入程度与网络社会满意度,详细数据如下:

从中可以分析出很多信息,在与社区属性分析所联系的方面而言:使用占比上,与热度数据相差较大,通过配对样本的t检验可证明其中存在强度不大的关联性。微博热度与抖音相当,但使用占比却远低于抖音,b站热度相对抖音微博差距较大,但使用占比接近抖音,这些热度与使用占比的关系可以一定程度证明各社区用户的活跃程度或是活跃比例,也能体现出用户对该社区的粘性,比如微博活跃用户对于微博社区的粘性较高、而所占总用户比例较低。
作品质量、环境氛围、社区得分可以用来分析用户对于社区的满意度,在考虑到一定主观因素的情况下也可以侧面描述一个社区的内容与氛围。根据图表来看,六大社区的作品质量得分都要高于环境氛围,这从一方面可以代表着当下后疫情时期的网络社会总状况——内容质量随时代与生活发展逐步提升,而环境氛围在各种近年的网络文化与用户素质的影响下逐渐改变。具体来看,其结果与社区属性特征词集相对契合,例如以精细化、工具属性为特征的小红书与以内容化、问答模式为特征的知乎作品质量偏高,而微博与贴吧的三项分数都为六社区最低,作品质量与总分6分以下,环境氛围跌破5分,这与贴吧的情绪化、攻击性与微博的明星化、炒作风气或许分不开关系。值得注意的是,b站无论作品质量、环境氛围还是总得分上都比以客观条件为主分析出的分数要高、且远远高于其他社区,也是唯一一个有且三项都在7分以上的社区,这可能与b站和年轻一代的高契合度、亚文化潮文化的特征有关。
各社区使用与不使用的用户对于网络社会的环境评分也是一个很有趣的数据。使用抖音的用户对于网络社会的评分比不使用的用户要高出10分,这其中的因素既可能有网络社会整体与抖音社区有着较高契合性,即体现出抖音社区对整个网络社会的高影响力与舆论导向,这与本文对抖音社区属性的分析也形成对应,也可能有抖音社区用户相对而言互联网陷入程度较低的关系,与抖音社区的碎片化、生活化特征关联较大。而使用知乎、贴吧、小红书的用户比不使用的用户对于网络社会的评分能低出5分左右,最为突出的是,贴吧使用用户对于网络社会整体评分比不使用用户低出6.86。结合三个社区的使用占比与陷入程度,可表现出三个社区用户对于网络社会的高依赖性,以及三个社区都以网络社会的一部分特征人群、团体为主。
关于可选择性回答方面,整体网络社会的评论词云如图所示:

可发现在完全匿名的问卷评论下高频词多为负面词汇,这也体现着当下网络社会的环境状况。为分析社区环境数据、用户陷入程度数据与用户对社区的满意度关系,可以进行多因素方差分析(SST = SSA + SSB +SSAB + SSE)。可得出,社区环境数据与用户满意度呈正相关,陷入程度与用户满意度呈负相关,即环境越好、陷入程度越低、对网络社会满意度越高,这在上表的抖音数据与贴吧数据上也具有明显体现。但值得注意的是,环境数据与陷入程度的交叉参数SSAB对于SST的影响比任何一个单因素SSA/SSB都大,这也表现了环境糟糕和陷入程度对用户的满意度影响是相辅相成的。

五、结论综述
网络社会是近年来国内学术界研究的一大热点问题,其研究涉及了哲学、社会学、新闻学、传播学、计算机科学、经济学、管理学、教育学、情报学、统计学等多个领域,研究角度也呈现出多样化的特点。其在分析单位的选择上,也多采用个体与网络两个角度来研究,本文也采用这种方式。在本文的研究中,主要方面是以客观条件为主的社区属性特征词分析与以问卷调查为主的随机人群数据统计分析,两个方面相辅相成,取得了很好的研究结果。
在当今后疫情时期的网络社会中,网络文化风气逐渐异常、畸形,以领域内现有的定义而言就是熟人化与普泛化。网络社会上因其完全匿名性而形成了与现实社会俨然不同的网络道德,这也是当今网络社会乱象丛生的源泉之一。在网络社会上,各种侮辱称呼、矛盾冲突、党同伐异、舆论造谣更是屡见不鲜,对用户形成着无形的影响甚至于是网络暴力。当下后疫情时期的网络社会,已经完全有了其独属于自己的社会属性与风气,这与现实社会的极大差异致使二者形成了可悲的后障壁,这或许也是尽管国家政府政策措施逐年开展,但却不能对于网络社会风气造成较大改变的原因。
对于当今网络社会现象的种种问题,匿名性或许是最根本的源头之一,对应于在当今互联网社会中令人闻虎色变的犯罪词语——“开盒”,网络社会就那样被名为匿名性的黑布所遮盖着,成为着无数人找到的一块暗地里吐黑泥的环境。如同多数人群的实名制与整顿的呼声一般,其关键还是需要国家与政府的加大力度管理,但以网络社会的实际情况出发是最重要的,否则仍会被网络与现实之间的厚障壁所阻碍着。
除此之外,网络社会朝向稳中向好的改变,更需要网络用户的努力。这并非一朝一夕可以改变的,正所谓网络社会中各种现象的原因也多来自于现实生活,多属于现实生活吸收下排出的东西,这需要各方一起的共同努力。但仅说现在,对于个人而言,减少网络社会的陷入程度是相对最优解;对于公司、团体、或像是高校组织而言,增加网络社会的话语权和舆论导向的影响力也势在必行,以尽力减弱网络社会对现实社会或是物质权益的反噬影响。

六、不足之处与改进方向
(1)对于社区属性特征词提取方面,仅仅使用文字云进行词频分析,视客观条件情况仍具有较高的不稳定性与不可行性,可以进行用Jieba库的代替,或是直接结合大模型与深度学习运用IF-IDF算法与TextRank算法,这样进行的研究前景更为广泛,也有更高的可行性与稳定性。
(2)对于问卷填写对象的选择方面,仍具有较强的随机性与随意性,可考虑改善问卷填写的对象选取方式或是填写问卷的形式。
(3)对于问卷数据分析方面,本文的分析主要围绕整体的网络社会状况,并没有进行详细分析。若进一步分析六社区的各项评价,可以获得更多有用且很具有参考性的信息。
 
七、结语
在本次关于“后疫情时代的国内网络社会情况”暑期调查研究中,团队走访了包括河南省、湖北省在内的多个省市,进行线下与专业人士交谈;结合专业人士观点,对抖音、微博、bilibili、知乎、贴吧、小红书六大各具特点的代表性网络社区进行研究;创造问卷填写人群普适性强,从10岁以下至60岁以上普遍有所收集,填写用户也遍布国内各个省市;运用爬虫技术、自然语言处理技术、数据统计等多种方式客观与主观结合的进行研究。团队成员既学到了技术知识,也增加了社会阅历与实践经历,这对于每一个团队成员都意义非凡,本文最终所有分析结论也会进行发布,结合现实情况,与公司相关人员进行说明,并开展线下入校园讲座,积极将暑期研究结果输出出去。
 
八、参考文献
  1. 丁然.基于Python爬虫技术的高校网络舆情数据分析研究——以“安徽审计职业学院百度贴吧”为例[J].现代信息科技,2023,7(05):106-108+112.DOI:10.19850/j.cnki.2096-4706.2023.05.025.
  2. 曹丹阳,赵俊生,李尽辉等.基于Jieba分词的青城旅游景点本体构建研究与应用[J].内蒙古工业大学学报(自然科学版),2021,40(03):218-225.DOI:10.13785/j.cnki.nmggydxxbzrkxb.2021.03.009.
  3. 何梓源. 基于词频词义的弹幕关键词提取与类别标注研究[D].北京信息科技大学,2023.DOI:10.26966/d.cnki.gbjjc.2022.000039.
  4. 贾二鹏,陈建新.国内外虚拟社区研究[J].新世纪图书馆,2011(12):32-36.DOI:10.16810/j.cnki.1672-514x.2011.12.009.
  5. 孟韬,王维.社会网络视角下的虚拟社区研究综述[J].情报科学,2017,35(03):171-176.DOI:10.13833/j.cnki.is.2017.03.030.
作者:数学与统计学院 柳宿辰 来源:山东大学(威海)数学与统计学院于网络中的调查队
  • 后疫情时代的国内网络社会状况分析
  • 后疫情时代的国内网络社会状况分析
  • 当今社会中,网络社区愈发占据着更多的社交环境,成为许多人日常生活不可分割的部分,但与此同时,网络社区环境随着近年来疫情影响导致
  • 08-16
  • 石榴花开  文化绽放——皖南医学院“医心”志愿服务队赴新疆
  •   “追蓝”小队参观遵义会议纪念馆 ————“大学生‘三下
  • 我运动,我健康;我快乐,我阳光。
  • 我运动,我健康;我快乐,我阳光。
  • 二十大强调要“加强青少年体育工作,促进群众体育和竞技体育全面发展,加快建设体育强国”为此,7月20日上午,兰州理工大学石油化工学
  • 08-16
  • 小厕所、大民生,我们在行动
  • 小厕所、大民生,我们在行动
  • 实践团与吴滩镇乡村振兴办携手行动,开展人居环境整治公路边垃圾清理约5公里,广泛推广农村三格式无害化厕所改造及积分制运行,成功推
  • 08-16
  • 星星之火 薪火相传——长沙理工大学计通学院星星之火红色故
投稿流程投稿须知常见问题积分充值