在线约会:吸引力背后的技术

当乔想找到爱情时,他转向了科学。

这位34岁的航空航天工程师没有去酒吧闲逛,也没有寄希望于偶然的约会能成功,而是报名参加了eHarmony.com该公司使用详细的个人资料、专有的匹配算法和严格控制的通信流程,帮助人们找到完美的灵魂伴侣。

阿凡达帮你搞定第一次约会

阻挡坏人

你的资料保质期长得吓人

去年秋天,在三个月的时间里,乔找到了500名似乎符合他的标准的人。他主动联系了其中的100人,与50人通信,约了3人,最后才找到合适的对象。他现在的恋爱关系很幸福,虽然他一开始对此持怀疑态度,但他说高科技在他的成功中扮演了重要角色。

互联网约会网站是网络上的爱情机器,它们是大生意。eHarmony2008年12月的数据显示,类似网站仅在一个月内就吸引了2210万独立访问者comScore Media Metrix

与许多社交网站不同的是,它们实际上是赚钱的——顶级网站每年能带来数亿美元的收入,其中大部分来自订阅费。

这些在线约会服务是基于技术、科学(有人说是伪科学)、炼金术和市场营销的奇妙组合。在幕后,他们将大型数据库与商业智能、心理分析、匹配算法和各种通信技术(是你的在线《阿凡达》准备好进行一次小小的虚拟约会了吗?)来撮合孤独的单身人士,并将一次性访客转变为每月付费订户。

然而,网上并不都是巧克力和玫瑰。安全是电子约会服务面临的一大挑战,它可能会吸引恋童癖、性侵犯者、骗子、垃圾邮件发送者和彻头彻尾的骗子——最明显的是,那些自称单身但实际上已经结婚的人。和棘手的问题这些网站对你的个人信息拥有什么权利——他们如何使用这些信息向你推销其他服务,他们是否以及如何与广告客户分享这些信息,以及在你离开后他们存储这些信息多长时间,这些问题还有待回答。

最后,还有一个最大的问题——在帮助人们找到真爱方面,这些技术驱动、算法密集的网站是否比当地的酒吧、教会团体或街头偶遇更好?

带着这些问题,一张还算过瘾的大头照,和一个非常耐心的妻子,我开始探索网络约会世界背后的秘密。

在线约会背后的商业模式

据预测,一个运行良好的网络约会机器每年可以产生超过2亿美元的收入,而这个市场预计在2009年将达到10.49亿美元,只有游戏和数字音乐网站能产生更高的收入,并预计将以每年10%的速度增长福雷斯特研究公司

大多数在线约会网站的大部分收入来自订阅服务,尽管免费的、靠广告支持的网站开始占据一些地盘。

事实上,大量的鱼该网站是去年访问量第二大的在线约会网站,仅次于SinglesnetHitwise的数据,一种网站流量监控服务。

大多数交友网站都允许用户免费注册并创建个人资料。

然而,在与匹配者交流之前,访客必须注册为付费会员。

要想成功,一个网站需要做到以下几点:

提供良好的响应时间。人们想要即时满足,所以网站试图在用户创建账户并完成个人资料后,至少给他们提供一些匹配项。

将至少10%的注册访问者转化为付费用户——最好是更多。

提供一个可接受的范围内的可能的匹配,并提供各种方式来追求这些前景,包括高科技的发展,从视频聊天到照片逼真的化身。

保持质量的前景池通过除草活性高、行为不端的用户和通过阻断新账户每天的10%或更多,估计是骗子,骗子,罪犯,性捕食者和其他不受欢迎的人,可以压倒一个网站和赶走付费用户。

一旦一项服务有了库存并拥有了付费客户,这场战斗就不会结束。该公司需要不断加大投入,以吸引新用户,因为通常情况下,10%的实际付费用户中,有一部分人使用时间不到3个月。

但是,一个人的愚蠢是另一个人的财富:很多顾客在找到他们的“真爱”后,会从爱情的马车上掉下来。该约会网站的首席执行官兼创始人赫伯·维斯特(Herb Vest)表示,他们会一次又一次地回来,产生一个有很长的尾巴的收入流True.com

第一步:完美搭配,迅速上桌

在线交友网站为用户提供配对服务有两种基本方法。

网上个人服务,例如雅虎交友(1个月29.99美元,3个月59.97美元,6个月95.94美元),这些都是被美化了的搜索引擎——庞大的、可搜索的数据库。用户填写一个简短的个人资料,包括复选框项目和关于自己的简短描述。

然后,他们根据性别、邮政编码、种族、宗教、婚姻状况和是否吸烟等标准过滤潜在用户,从而缩小搜索范围。用户自己对结果进行筛选,决定要追求哪一种前景。

“科学”配对服务,如eHarmony(一个月59.95美元,三个月119.85美元,六个月179.70美元)、PerfectMatch和Chemistry.com,尝试通过询问几十到几百个问题为用户找出最匹配的人。然后,这些服务组合出一份个人档案,并利用它来与一种算法进行对比,该算法根据一组预定义的类别对用户进行排名;从那里,系统生成一个适当匹配的列表。

有些网站采用了混合方法。例如,PerfectMatch.com不仅提供推荐选择,还让客户自己浏览“库存”。

这些交友网站使用的技术有非常简单的,也有非常复杂的。不出所料,eHarmony拥有最复杂的数据中心之一。雷竞技电脑网站技术副总裁约瑟夫·埃萨斯(Joseph Essas)表示,该公司存储了约2000万注册用户的4tb数据,每个用户都填写了400个问题的心理资料(eHarmony的创始人是一名临床心理学家)。

该公司使用专有算法对这些数据进行评分“兼容性”维度比如价值观、个性风格、态度和兴趣等,并为客户提供长期关系的最佳前景。

一个巨大的Oracle 10G数据库会在用户注册后立即吐出一些初步的候选答案,以做好准备,但真正的匹配工作是在eHarmony的系统对数千名用户的数百个问题的答案进行评分和匹配之后才会进行。这一过程每天需要进行将近10亿次运算,这些运算需要大量批量处理。这些MapReduce操作在数百台计算机上并行执行,并使用开源软件进行编排Hadoop软件平台。

一旦匹配结果被发送给用户,用户的行动和结果就会反馈到模型中,用于第二天的计算。例如,如果一个客户点击了许多位于他或她地理范围开始的匹配对象(比如25英里以外),系统就会认为距离不是问题,并会提供更多距离稍远的匹配对象。

埃萨斯说:“我们面临的最大挑战是我们必须不断获取、移动、应用和服务于人们的数据量,而这些数据是流动的。”为此,该架构被设计为快速扩展,以满足增长和需求高峰在主要节日前后。最高的需求出现在情人节前夕。“我们的需求即使不是四倍,也是两倍,”埃萨斯说。

PerfectMatch.com自称拥有500万会员,它使用匹配算法,但其心理测试比eHarmony要求的时间短。“我们想用基本的概念幻相创始人兼首席执行官杜安·达尔说。该系统的核心架构包括5个前端Web服务器和一个大型后端SQL Server数据库,以及处理消息传递、营销和其他功能的各种服务器。匹配过程是立即进行的。

True.com还根据用户回答的大约200个问题提供“科学兼容性”匹配。该网站使用了大约200台服务器,包括一台运行Microsoft SQL server的64位32处理器Unisys服务器。匹配算法的计算是在64位服务器上执行的,这些服务器在内存中保存了整个多tb数据库的压缩版本,以促进快速匹配。首席执行官维斯特表示:“该系统可以毫不拖延地回击(比赛)。”

另一方面,Plentyoffish.com的理念是保持简单。该服务专注于搜索和过滤:它使用简短的问卷调查,如果用户需要,它确实提供了一些匹配功能,但首席执行长马库斯·弗林德(Markus Frind)表示,他不会推广这些功能,而且他对一些竞争对手提供的复杂匹配算法不屑一顾。

该业务仅在3个Web服务器、5个消息服务器和5个数据库服务器上运行(整个数据库只有200GB大小),但它每月为大约1200万用户提供2000亿个页面。弗里德说:“我一年的全部成本只有几十万美元。”他说,最大的问题不是技术,而是保持网站流量畅通所需的带宽。

步骤2:从“只是看看”到“付费客户”

在这个90%以上的用户从不付费的行业里,将用户转化为付费用户可谓是一场艰苦的战斗。这就需要大量的人口统计学和心理数据。

事实上,在线约会网站非常擅长使用个人数据,潜在客户想知道到底是谁被“撮合”了——两个真心相爱的陌生人,还是孤独的客户和需要他们的婚恋网站。(见网上约会:你的个人资料很长很可怕以了解约会网站如何挖掘他们收集的数据。)

Yahoo Personals利用其所掌握的所有信息,为用户量身定制其销售说辞。总经理艾伦•佩雷尔曼(Ellen Perelman)表示:“我们试图利用我们对用户的了解,以及他们对产品的参与度。”

一旦用户注册了一个免费账户,并填写了一份简短的问卷,雅虎就会使用定向信息来推动他们通过一个“转换通道”。根据用户的个人资料和他/她在网站上的行为,用户看到的劝说他们作为付费用户登录的信息会有所不同。

同样,PerfectMatch.com根据用户的个人资料和他们在网站上的任何时间的行为,将用户放在不同的“消息轨道”上。“你做或不做的每一件事都会引起反应,”达尔说。“我们收集这些信息,并进行实时对比分析,根据你的个人资料为你提供最好的服务。”

那些没有“充分利用网站”的用户——比如没有上传照片的用户,或者没有评论所有匹配的用户——就会成为系统的目标。达尔说:“你会收到一封根据你的情况定制的电子邮件,鼓励你采取必要的行动。”

eHarmony拥有最全面的用户档案,在利用这些信息的方式上可能也是最复杂的。它将信息——每天超过1tb的数据——从Oracle数据库中提取到高性能的数据Netezza数据仓库设备将用户分成行为和人口统计的“桶”。

“我们使用Netezza进行大量离线计算,试图了解用户行为的模式和商业智能,”Essas解释道。其中一部分反馈到匹配过程中,但它也有助于eHarmony说服用户订阅其服务。“因为我们对它们了解得更多,所以我们可以更好地针对它们,”埃萨斯说。信息是根据每个用户在网站上的行为和他们的个性类型量身定制的。

第三步:建立高质量的关系

一旦用户支付了订阅费,在线约会网站就会提供不同的技术手段来联系和了解潜在的约会对象,从聊天室到即时通讯、电子邮件甚至视频聊天,应有尽有。

eHarmony通过在其网站上引导用户通过一系列被禁止的通信步骤来控制这一过程。用户们说,这样做是为了让网站的用户彼此之间感到舒适,但有时技术会成为障碍,或者适得其反。

45岁的玛丽是一家大型IT咨询公司的主管,她说,当你真正想要的是与某人见面时,从eHarmony预先写好的问题和回答,到在线聊天,再到电子邮件,再到电话,这一过程可能会很乏味。“你不断地参加工作面试。”然后,在所有这些之后,人们会突然切断联系。“发生了什么事?”她问。

12 第1页
第1页共2页
2021年IT薪资调查:结果在