扫一扫 扫一扫 扫一扫 扫一扫 网易 UEDC – 盛少奇:互联网时代的「长尾理论」,让我们重新认识了小众用户、小众产品、亚文化群体的意义和价值。网络上的亚文化群体,包括嘻哈文化、二次元、同性恋文化、宅文化、小清新、非主流等等,小众群体包括小众作者的粉丝、小众产品的用户等;现实生活中,亚文化群体则包括性工作者、吸毒者、流浪艺人等所谓的「隐藏人口」。 如何研究这些群体,收集他们的信息为我所用呢?显然,概率抽样、问卷调查可能是一种流行的做法。 概率抽样的困境在研究小众群体或亚文化群体时,通常会面临一系列抽样困境:第一,这些小众群体或亚文化群体在总体中所占比例较低,群体的规模和边界不太清楚,很难找到合适的抽样框;第二,小众群体,尤其是亚文化群体的成员,常常因种种原因拒绝暴露自己的身份,这就加大了我们获取有效信息的难度。 举个例子:假设在 A 社交平台上,我们的研究对象是同性恋群体,我们想了解这群用户的情况。假设 A 社交平台有 1 亿用户,其中有 5 万名用户受同性恋文化影响。我们通过简单随机抽样,抽取一个 10 万人的样本(已经是相当大的样本了),从中可以得到的同性恋亚文化群体样本也只有 50 个左右,考虑到亚文化群体较高的拒访率,实际获得的样本可能更少。显然,概率抽样的效率极低。 受访者驱动抽样的优势那么有没有更好的方法呢?受访者驱动抽样(Respondent-Driven Sampling,下文简称RDS)在很大程度上能解决这种抽样困境。RDS 抽样承袭自雪球抽样(snow-ball sampling),先从总体中的少数成员开始调查,由已知成员推荐符合要求的新成员,然后样本像滚雪球一样越来越大。雪球抽样虽然操作简单,但它是非概率抽样,并非按照随机抽样原则来抽取样本,失去了大数定律的存在基础,也就无法确定抽样误差,无法准确地说明样本的统计值在多大程度上适合于总体。 RDS 不仅具有类似雪球抽样的易操作性,同时它又有效解决了抽样偏误和抽样概率未知等问题,可以对总体情况做出相对准确的估计。 RDS 抽样的理论基础源自社会网络分析(social network analysis)中的小世界网络(small world)理论。社会网络分析是一种分析社会结构的理论和方法,将人与人之间、群体与群体之间的联系视为一条条连线,整个社会结构就可以视为由各个点及其连线构成的一张大网络[i]。小世界网络是指,网络中大部分的节点彼此并不相连,但绝大部分节点之间经过少数几步就能联系在一起。 △ 小世界网络(Small-world) 哈佛大学心理学教授斯坦利·米尔格拉姆做过一次连锁信实验,证明平均只需要 6 步就可以联系任何两个互不相识的美国人,这便是著名的「六度分隔理论」。而 Facebook 2016 年公布的官方研究报告(Research At Facebook)则显示,全球 15.9 亿用户中间,仅仅隔着 3.57 个朋友而已。 △ 2016年,Facebook上15.9亿人中间,仅隔着3.57个朋友而已 弱关系的力量提到网络分析,就不能不提格兰诺维特以及那篇令他声名大噪的论文──《弱关系的力量》(The strength of weak ties),这篇论文是社会学史上引用率最高的论文,他本人也凭借其在网络分析领域的杰出贡献,作为一个社会学家,提名了诺贝尔经济学奖。 论文的核心观点是:与自己频繁接触的亲朋好友是一种「强关系」,通过这种关系获取到的往往是同质性的信息。但社会上更为广泛的是一种并不深入的人际关系(即弱关系),这种弱关系能够使个体获得通过强关系无法获取到的信息,从而在工作和事业上、在信息的扩散上起到决定作用。[ii] △ 强关系与弱关系 RDS 抽样依据社会网络理论认为,个人总是生活在一定的网络之中,一旦我们知道了这些亚文化群体或者小众群体的社会网络构成情况,那么我们也就能对总体人口的特征有一个比较清晰的认识。 RDS 方法与常规抽样方法的最大区别在于:常规抽样方法是先从界定清晰的总体中抽取出一定数量的有代表性的样本,然后根据样本情况直接估计总体的参数。而在 RDS 方法中,总体是尚不清晰的,从总体的社会网络中抽取样本,先估计样本所在社会网络的情况,然后再根据网络情况来推断总体的情况[iii]。 △ 常规抽样方法与RDS方法的差异 RDS抽样的具体操作方法
△ RDS抽样的具体操作方法 美国社会学家赫克索恩证明了 RDS 抽样方法是一个一阶马尔科夫过程(first-order Markovprocess)[iv],即样本在招募被访者的过程中会实现均衡,并与初始的种子相互独立。此外,他的研究结论还证实了,研究者初始选择的「种子」,并不需要刻意保持随机性,而且使用 RDS 方法无需经过太多轮次就可使样本达到均衡。 RDS 抽样在国外已有了丰硕的研究成果,尤其在诸如艾滋病患者、性工作者等亚文化群体中。赫克索恩也曾在互联网上使用 RDS 对在校大学生抽样,与常规概率抽样进行对比,并得出结论:RDS 的估计值不仅合理,还可以进一步提高精确性。 总而言之,对于用户研究来说,当我们研究的群体小众或用户调研参与意愿低,那么 RDS 不失为一种很好的替代概率抽样的方法。 参考文献:
欢迎关注「网易UEDC」公众号: 手机扫一扫,阅读下载更方便˃ʍ˂ |
@版权声明
1、本网站文章、帖子等仅代表作者本人的观点,与本站立场无关。
2、转载或引用本网版权所有之内容须注明“转自(或引自)网”字样,并标明本网网址。
3、本站所有图片和资源来源于用户上传和网络,仅用作展示,如有侵权请联系站长!QQ: 13671295。