如何看待Kaggle最新比赛Zillow禁止中国居民参加第二轮?

Zillow Prize: Zillow’s Home Value Prediction (Zestimate)

对应规则原文为:In addition, if you are a resident of China, you are eligible to participate and win a prize in the First Round, but are not eligible to participate or win a prize in the Second Round.


之前顾虑知识产权,现已取消限制。官方回复如下

Hi all, this is Cat from Zillow.

We apologize for the delayed response, but we wanted to take the time to do a full review of our rules. Our rule that restricted residents of China from participating in the second round was based on concerns around successfully obtaining intellectual property rights on inventions created in China and was in no way based on discrimination against residents of China. However, after further discussing with our legal counsel, we have decided to allow residents of China to participate in the second round.

We look forward to seeing your submissions.

The Zillow Team


看样子问题解决了:“However, after further discussing with our legal counsel, we have decided to allow residents of China to participate in the second round.”

Zillow Prize: Zillow’s Home Value Prediction (Zestimate)


都散了吧,Kaggle和Zillow团队已经公开致歉了,不过这一切都是在Kaggle上的中国居民公开质问之后才有的。 KaggleZillow的反应很迅速,解释也还诚恳,不过这种隐形歧视不知道还有多少,中国人得到国际平等地位的历史进程还遥遥无期。 不多说了,我要为中国的崛起先去打比赛了,(逃......

—---—----------------------手机码字分割线

怎么看待?不要怂,要敢于斗争,又要善于斗争。认识Kaggle公司员工的可以和他们的员工反映这个问题,看看能不能从内部解决。不认识的,去这个比赛下面的discussion部分发声,给Kaggle发邮件,看他们如何回复。过一段时间,看看他们有什么反应?没反应继续发,水军淹没discussion,ddos Kaggle服务器,社工他们CEO邮箱发公开质问信,在美中国留学生看能否组织起来发律师函。

我已经开始做第一步了,要不要其他的看接下来kaggle的反应了。希望大家能团结一致,这不单单是一个禁令......


看了规则确实一头雾水。主办方不给任何理由就突然加这么一句确实很让人费解。

但我非常不容易高票那个思路,这种处理顺序是不合理的。走舆论和法律程序才是第一要做的事情。认识内部员工去沟通或者写信私下沟通没有什么意义,这种事情上只会是自讨没趣了。

找一些有影响力的(不一定要是华人)行业相关人士在社交平台上公开发表质疑,先把事情的影响力变大,后面自然有媒体和律师自动跟进的。

Kaggle和zillow也是,只说这么做不说为什么,这只能让把自己往漩涡里带。持续关注事件发展。

ps 讨论怎样的情况算resident的别再歪楼了好吗?

pps Zillow在房产app里面也算是难用到家了,比竞争对手的体验差一大截。


在官方论坛上找到了相关问题,感觉下面的部分回答分析得还不错,我把大家目前的讨论贴出来简单翻译一下。

题主:李定国

Why the Chinese residents are not allowed to participate in Second Rround?

In the Competition Overview, ELIGIBILITY NOTE, the last sentence states that "In addition, if you are a resident of China, you are eligible to participate and win a prize in the First Round, but are not eligible to participate or win a prize in the Second Round". I don"t know why the the competitors from China can not even participate in the Second Round. We obey the rules and enjoy the competitions same as anybody from anywhere of the world. If no one wants to explain this rule, could we regard this competition contains Racial Discrimination, which is indeed illegal in USA?

问:中国居民为什么不允许参加the Second Round?我们遵守规则并且和来自全球各地的参赛者一样享受比赛。如果官方不进行解释,这条规定是否有种族歧视的嫌疑?这不是明显违反了贵国法律吗?

答主:mkabata

As long as this is about residency and not actually race or nationality, I don"t think you can make the case. They are not excluding Chinese nationals who are legal residents of USA (as in green card holders, etc) nor USA citizens of Chinese origin, so not sure how that would be a racial discrimination.

And it"s actually quite common that to be eligible to participate (actually "win" but buying lottery ticket in a lottery where you are not eligible to win is hardly a smart move, so they limit participation) in certain contests/competitions/lotteries you have to be a legal resident

答: 只要提及的是居住权而非种族或者国籍,就不存在所谓的“种族歧视”。他们没有排除具有合法美国居留权(比如有绿卡)的中国国籍参赛者、或者华裔美国居民,所以“种族歧视”不成立。

其实对于竞赛、比赛、博彩这类活动来说,允许参加往往伴随着允许“获奖”,所以必须是合法居民才能参加的这一项规定还是挺常见的。

(Comments:这解释了为什么允许参加第一轮而不允许参加第二轮,目的是不想中国居民获奖)

答主: Sangxia

There are countries on the sanction list that is described earlier in the rule so it"s certainly not only residents in China. I don"t know anything about the details involved in such transactions, but one can imagine moving a large sum of money cross borders is not entirely trivial, and that might be a reason.

答:在之前声明的规定当中,除了中国居民,其实很多国家(的居民)都没有参赛资格的。我不太确定具体的情况,不过你想想如果要跨境发巨额奖金,这成本也不可能不算对吧

答主:mkabata

Actually, no, it can not. Race is protected under US law. Unlike country of residence... Plus it"s also about a company giving away the price, not Kaggle. I can very easily see Chinese company hosting a competition for residents of China only and that does not mean Kaggle is suddenly discriminating against anyone - they are just providing the platform. And companies have to comply to laws of their countries of origin.

(这一段我觉得比较有道理。)

答:美国法律保护的是种族、并不是居住国。另外,这是第三方盈利性公司 (注:Zillow是一家提供房地产数据服务的公司) 赞助发奖金,而不是Kaggle。比如中国公司举办一个比赛,奖金只发放给中国人,这应该很常见吧。所以这并不意味着Kaggle在“歧视”任何人,他们只是平台提供者。

---------------------------------------------------------------

原贴中,题主和众多国际网友唇枪舌剑,不过内容价值不大我也不去翻译了,大家有兴趣可以看原贴: Zillow Prize: Zillow’s Home Value Prediction (Zestimate)

原贴的题主有一些气急败坏,说了很多逻辑经不起推敲的话,有点上纲上线,相对地这个mkabata说话还比较有理有据比较客观。(个人观点)

我总结一下吧:

1. Zillow禁止中国居民参赛确实很刺激我们的痛点,我刚看的时候也非常震惊。其中肯定包含了一定“歧视”的意味,不过没办法的是,它并没有明显违反规定。

2. Kaggle只是平台提供商。Zillow亦不是慈善机构,它有充分的理由去削减开支,没必要增加跨境授奖的成本。具体来说,它是一家提供房地产数据服务的公司,它赞助这个比赛不就是一个广告吗,中国居民远程参赛,拿了奖,其中能转换为实际客户的能有多少?就像比如万达举办一个万达杯,比的是人熊互搏,奖金丰厚,可以预见如果全世界的人都可以参赛的话,奖金多半被战斗民族拿走,而战斗民族会跑来中国买你万达的房子吗?这亏本生意肯定不做。

3. 如果我用最单纯的目的去揣测Zillow的话,它是一家商业公司,本意肯定只是削减开支(就算总奖金金额一定,它肯定也想削减 成本/用户转化率 的比例)的,绝对没必要去涉嫌“歧视”。当然,实际情况可能是,他这条规定会惹怒很多中国人(包括拿了绿卡的或者华裔),名声也被搞坏,造成负面商业影响。

4. 如果为了避嫌的话,它应该声明只准美国居民参赛,而不是单纯禁止中国居民参赛。但这样比赛的含金量和影响力覆盖面又没办法突显。

5. 不管是真歧视还是真只是为了削减开支精准投放广告,禁止中国居民参赛的这条规定从某种意义上来说都是Zillow的昏招,起码招中国人恨或者抵制是跑不掉了。当然,通过“种族歧视”这种易燃易爆炸的话题来增加曝光率或许能给它带来正面商业效应也说不定,我就不阴谋论了。

6. 当然,能争取的权利一定要去争取,让大家知道"Our voices matter"很有意义。

7. 总之,大家中国人还需要努力,有朝一日不需要看别人脸色说话了才是硬道理。自己举办比赛,自己想规定什么人参赛就什么参赛,等别国人在网上抱怨吧。


看猜测都很有意思,我觉得最主要的原因还是国内高手参赛有很大几率拿奖,这边的规章上过不去。

害怕数据泄露是说不过去的,奖金类型的比赛前几名的选手最后拼的还是模型嘛。至于国人对房地产有更好的先验知识,我想说在如此巨额奖金诱惑下补点先验知识还不容易吗?

当然,还是想对ZillowKaggle说一句mmp,“你们这样子啊,不行的!”

----------------------------------------------------------------------------------------

很高兴看到规则更改,“不利于中美友好的事,绝不要去做!”


官方解释说是知识产权问题(IP right)一开始没解决,后来解决了。知识产权方面的东西我不太懂,不过主办方搞事的嫌疑是抹不掉的...

设想我是主办方第一次搞这种数据比赛,某个国家高手如云而且很可能会屠榜,这个时候法务小姐姐进言,说给他们发奖金要多考虑不少问题,例如所得税啦知识产权啦blabla。我听得云里雾里,索性大手一挥,干脆把这个国家的选手全ban掉拉倒...

上面只是个人猜测,不过从过程来看同胞的反应还算令人欣慰的,discussion板块里有人义愤填膺当冲锋狼,有人讲逻辑在平民堆里号票,最终算是争取到一个还算能接受的结果。这种事情就该按闹分配嘛,不然谁鸟你...

---- 第二天起床看到事态发展的分割线 ----

不让你们参加就对了,谁叫你们去年老是喊楼市永远涨...

---- 正经的分割线 ----

去网站看了一眼,不少同胞已经在discussion板块里质疑了,也有不少外国吃瓜群众声援。这件事乍一看挺像种族歧视的,但是仔细一想和种族歧视又不太沾边...真的针对全体华人的话以kaggle的能力难道不写一个识别系统嘛,把所有看起来ching ching chong chong的ID全部ban掉...

总之等官方解释咯,毕竟官方和比赛主办方什么话都没说呢。

倾向于“第二轮数据含有涉密内容”的猜测,毕竟去年中国楼市如此后现代,这些数据也够不少人喝一壶的吧,弄个比赛感觉绰绰有余呢


我猜可能是涉及到发奖金的法律障碍。我在美国常玩的一个游戏,能赢金币还能兑现,但不是在所有地方都能玩。有的州和国家要年龄限制,有的地方干脆不能押金币,只能进不带金币的。游戏公司肯定希望全世界玩家哪怕是六岁小孩都来押金币,但是法律惹不起啊,美国执法严难通融,一桩案子够喝一壶了。


我是居住在美国的中国人,请问我是否有资格参加呢? 搞的好像是个金元宝似的;难道只要参加人人有奖? 其实,除非您是大牛或者非常死心塌地要做data scientist;DS的工作真真不如SDE好找,pay还没有SDE高;有搞kaggle的功夫还不如好好刷leetcode 不说了,赶紧去刷leetcode了


难道是担心中国人民参赛把房价炒高不成?


一点微小的工作,

中国人一~律~不得从机!


很好奇为什么不让中国居民参加。很好奇这样做究竟主办方能有什么好处。

如果是所谓的种族歧视是不是太可笑了,为什么好端端的要往枪口上撞呢?


这个世界一共就两个国家,中国和外国,现在外国人在自己国家参加比赛,不要其他国家参加,这也可以理解嘛


我非常不喜欢没事就往种族歧视上考虑问题。尤其是希望在美的中国人,不要有这种惯性思维。因为很多时候,大家针对的不是你的种族,而是其他的东西。

比如,喜欢抢中国人,是因为中国人有钱,而不是因为你是中国人。有人对你的英语不耐烦,是因为你英语不好,而不是因为你是中国人。有人对你态度不好,是因为他对谁都态度不好,不是因为你是中国人。在公司有人欺负你,是因为你的性格或者做事方法,而不是因为你是中国人。等等等等。很多很多问题,其实都可以用很简单的种族歧视来解释。但是实际上原因根本不是这样。

我觉得我比较赞赏这种态度。你们歧视我是你们的事情。我做好自己的事情,为国家争光是我的事情。就好像天天反战并不能解决战争一样,希望大家把时间精力放在提高国家荣誉的事情上,而不是四处找人作斗争的事情上。就是提高一下上限,而不是着力于提高下限。上次,看到朋友圈有人转发chinese life matter的组织的东西,我真的觉得没什么好的。black life matter也没有帮黑人社区做什么好事。


简直是歧视,闻所未闻,有回答者说中国选手有先验知识,首先,这类比赛根本没有选手没有先验知识,这只是多与少的问题。其次,要确保选手没有先验知识,应使用更客观的测量方法,而不是限制某个国家的所有选手。第三,这些比赛对某一部份选手总会有利,例如某个比赛正好适合用某个模型,正好有选手熟知这个模型,他便有优势了,我们根本不可能限制所有选手都在相同的起跑线。


已经解决了?我还以为天池会成最大赢家。


事情基本解决,还是靠大家愿意站出来提出抗议。(虽然有些话稍有激动)

还有就是,比以前更喜欢anokas小哥惹~ 虽然他还是个高中生。。。&>_&<


应该是中国大陆地区的参赛者竞争力太强了,结果弄成奥运会乒乓球比赛的局面就尴尬了。

看到有人提到知识产权问题,不了解Kaggle的第二轮比起第一轮不是开源了么? 是不是不让参加比赛就看不到源代码?这个是唯一能够想到可能与知识产权联系起来的地方,把开源代码拿走开个公司,是不是怕这个?


中国居民不是中国国籍,居住超过6个月都算当地居民。没有国籍歧视,而且理由是针对中国的知识产权保护,中国政府机关这方面确实做的不好。散了吧,英文不好,常识少引起的误会。


如何看待英文这门乳化语言表达能力不行,故意把大陆居民和中国人两个完全不同的概念搞得那么相似?


推薦閱讀:

kaggle:Titanic: Machine Learning from Disaster,有什麼比較好的feature可以提取,哪位大神hit 80%了?
如何看待 Kaggle 被 Google 收購?
機器學習如何在小樣本高維特徵問題下獲得良好表現?
Kaggle 的比賽在 Machine Learning 領域中屬於什麼地位?

TAG:数据挖掘 | 机器学习 | Kaggle |