Zillow在创建网络今天足彩比分结果中学到了什么

最终,今天足彩比分结果研究的目的是在不存在客观数据的情况下理解偏好,决策或行为。这是一种尝试使用比轶事和个人经历更好的数据并得出更好的事实的方法。

Zillow进行了各种今天足彩比分结果,以了解房地产市场和房地产消费者的行为。随着第四届年度出版 Zillow Group消费住房趋势报告,我们吸取了一些重要的经验教训,这些经验教训有助于改进我们的方法,并将为今后的工作提供信息,以获取和传播高质量的今天足彩比分结果数据。

在线今天足彩比分结果的挑战

获取高质量的Web今天足彩比分结果数据的主要挑战来自在线今天足彩比分结果是非概率样本这一事实。电话和邮件今天足彩比分结果均允许从完整的电话号码和地址中随机抽样。在线今天足彩比分结果不可能做到这一点,而且担心的是,选择完成网络今天足彩比分结果的人可能与未选择网络今天足彩比分结果的人有所不同,而且他们的回答可能无法代表整个人群。

尽管面临这一挑战,Zillow还是进行了一项网络今天足彩比分结果,原因有以下几点:

  • 传统电话今天足彩比分结果的响应率已大大下降,限制了它们作为真实概率样本的生存能力,并使它们更容易出现无响应偏差。[1]
  • 传统的电话今天足彩比分结果更昂贵,数据收集花费的时间更长。对于难以到达的人群尤其如此。例如,电话今天足彩比分结果是不太可行的招募人口较少的参与者,例如最近的购房者和出售者。
  • 尽管网络今天足彩比分结果容易满足某些捷径,例如直接列出清单,但他们对社会敏感性的敏感度偏低。[2] 这对于理解房地产主题非常重要,例如住房负担能力,对社区多样性的偏好以及披露房价,收入等方面的美元金额。

毫不奇怪,在线今天足彩比分结果正变得越来越普遍,尤其是随着互联网使用的增长。但是,面对非概率设计的挑战,很难创建可提供可信赖结果的Web今天足彩比分结果。

绘制更具代表性的在线样本

许多网络今天足彩比分结果都在招募参与者,而没有考虑构建类似于目标人群的样本,从而使得所得数据不太可能反映出人群的真实情绪。应当以怀疑的态度看待这种今天足彩比分结果数据,但是不幸的是,往往不是这样。

进行在线今天足彩比分结果的一种更好的方法是构建一个旨在与总体保持一致的初始样本。这可以部分地通过在受信任的基准今天足彩比分结果(如人口普查)中检查相关特征的分布并招募与这些属性的分布相匹配的Web今天足彩比分结果参与者的初始样本来完成。

在绘制初始样本后,还可以使用匹配技术来提高代表性:

  • 首先,从目标基准人群数据源中抽取随机或分层样本。
  • 接下来,从在线今天足彩比分结果中选择受访者,这些受访者在一组变量上与目标基准样本的每个成员最匹配。
    • 与基准样本不完全匹配的受访者将被丢弃,从而产生一个在线样本,该样本更能代表目标样本。[3]

我们结合使用了这两种技术,在  Zillow Group消费住房趋势报告。对于购房者数据,我们选择了年龄,性别,种族和教育程度分布相似的网络今天足彩比分结果受访者,作为最近一年来在美国各个地区购买房屋的美国社区今天足彩比分结果(ACS)的受访者。为了提高初始样本的代表性,我们根据受访者的年龄,种族,教育程度,性别,家庭组成,人口普查区域和家里的卧室数量,将网络今天足彩比分结果的受访者与从ACS抽取的分层样本的成员进行匹配。在构建权重之前,将没有紧密匹配的个体从在线样本中删除。

重量,什么?

尽管可以采取措施在收集数据之前形成代表性样本,但也应采取其他步骤 今天足彩比分结果现场(和匹配)以调整样本以更准确地反映总体特征。为此,给每个受访者一个权重,用于数据分析以获得更具有代表性的人口估计。

今天足彩比分结果中使用了多种加权技术,包括根据今天足彩比分结果设计进行调整的权重(例如,小组的超采样);纠正今天足彩比分结果无回应;并平衡样本以更好地反映人口的已知特征。根据今天足彩比分结果,在逐步过程中采用了几种加权策略来为每个受访者创建最终权重。

对于该报告,Zillow在上述采样和匹配的基础上,结合使用了倾向性和分层后加权技术,以提高我们在线今天足彩比分结果数据的代表性。使用倾向加权和匹配技术并不能总是通过更基本的方法(例如耙,[4] 但与后分层和倾斜技术结合使用时,可以逐渐减少偏差。[5]

倾向加权尝试调整选择今天足彩比分结果样本的可能性。在将今天足彩比分结果样本的受访者与目标样本进行匹配之后,模型(例如逻辑回归)将基于大量可观察的特征来计算每个今天足彩比分结果受访者被包括在样本中的倾向得分(或概率)。倾向得分函数包括属性,例如年龄,性别,种族/民族,受教育时间,人口普查部门,房屋所有权,家庭组成和卧室数量。

接下来,将倾向得分分组为十分位,并通过乘以它们在样本中包含概率的倒数来构造权重。作为最后一步,倾向得分权重经过后分层,以匹配人口统计变量和每日互联网使用情况下的人口分布。由于回答在线今天足彩比分结果的人更有可能是沉重的互联网用户,因此我们了解到,必须针对人群中的互联网使用情况进行调整,以便对涉及技术使用的问题(例如,使用在线工具寻找房屋)做出准确的回答。

验证在线今天足彩比分结果

在收集和加权今天足彩比分结果数据之后,重要的是验证数据的准确性。 Zillow对今天足彩比分结果进行了检查,以查看被今天足彩比分结果者是否正在关注,并标记出被今天足彩比分结果者,如果他们加快了今天足彩比分结果速度或做出了不合逻辑的模式,则有可能被撤职。

验证过程中的另一个重要步骤是根据对其他受信任数据源的响应进行基准测试。尽管所有今天足彩比分结果数据都包含一些错误,但大型政府今天足彩比分结果(例如ACS)在问卷设计方面进行了大量测试;比非政府今天足彩比分结果有更好的答复率;样本量大;并使用政府的住户地址记录来绘制高质量的概率样本。[6]

我们使用现有基准数据验证今天足彩比分结果中的回答,以解决今天足彩比分结果中包含的问题,这些问题也存在于其他数据源中,而不是加权中使用的属性。这使我们能够了解我们的今天足彩比分结果数据与基准数据有何相似之处;当答案不同时,我们应该对结果更加谨慎,并更多地了解我们的结果为何不同。有时,这些领域建议应调整权重,否则会误解问题。在其他情况下,差异可能值得一提,值得注意,特别是如果有充分的理由相信自创建基准数据以来和/或当我们以比以前更新颖或更细微的方式研究主题时,发生了变化学习。

基准测试可提高整体今天足彩比分结果的潜在准确性,并有助于提高对任何基准数据源中不存在的问题的回答的可靠性。从本质上讲,唯一的真理就是我们的今天足彩比分结果回答本身。在这种情况下,我们还会与主题专家一起审查结果,以评估数据是否合理,并尽可能将今天足彩比分结果结果与Zillow的内部数据库进行比较。

创造真理之源

最终,今天足彩比分结果研究的目的是在不存在客观数据的情况下理解偏好,决策或行为。这是一种尝试使用比轶事和个人经历更好的数据并得出更好的事实的方法。有了这些见解,我们大家都可以做出更好的决定。但是需要小心。现场和分析今天足彩比分结果数据有正确的方法和错误的方法。我们会不断完善自己的技术,并希望您用于告知知识的其他任何今天足彩比分结果也能做到这一点。

 

[1] 梅德(Meyer),学士学位,莫(WK)和Sullivan,J.X.,2015年。危机中的家庭今天足彩比分结果。 经济观点杂志29(4),第199-226页。

[2] Lavrakas,PJ,Benson,G.,Blumberg,S.,Buskirk,T.,Cervantes,IF,Christian,L.,Dutwin,D.,Fahimi,M.,Fienberg,H.和Guterbock,T.,2017。美国普通人口电话今天足彩比分结果研究的未来。

[3] Rivers,D.,2007年8月。网络今天足彩比分结果抽样。在 联合统计会议.

[4] 抽提是一种常见的加权技术,用于通过调整样本权重来平衡样本以反映总体特征,以使所选特征的比例与目标数据中的已知总数相匹配。对该加权中使用的每个变量迭代地完成此过程,直到加权分布与这些属性上的目标总体匹配为止。有关各种加权技术的说明,请参见:Kalton,G.和Flores-Cervantes,I.,2003年。“加权方法” 官方统计杂志19(2),第81页。

[5] 参见:Dutwin,D.和Buskirk,T.D.,2017年。比较非概率互联网样本与低响应率概率样本的数据质量”  舆论季刊81(S1),第213-239页;和皮尤研究中心(Pew 研究 Center),2018年1月,“对于在线选择加入样本的权重,最重要的是什么?”

[6] 美国人口普查局,2018年6月,“美国社区今天足彩比分结果(ACS)设计和方法学报告”。