Kaggle是什么?
Kaggle创立于2010年,主要为开发者和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码,谷歌于2017年3月收购了Kaggle,现已成为世界上最大的数据科学社区,拥有强大的工具和资源来帮助您实现数据科学目标。
Kaggle的英语发音
Kaggle的英语发音类似“kai gou”,而不是“ka gou”。
Kaggle是干嘛的?
Kaggle是数据科学家的社区——这是他们度过夜晚和周末的地方。它是一个众包平台,吸引、培养、训练和挑战来自世界各地的数据科学家,以解决数据科学、机器学习和预测分析问题。它有来自194个国家的536,000多名活跃会员,每月收到近150,000份提交的资料。Kaggle始于澳大利亚墨尔本,2011年迁至硅谷,从Hal Varian(谷歌首席经济学家)、Max Levchin(Paypal)、Index和Khosla Ventures等人那里筹集了约1100万美元,然后最终于2017年3月被谷歌收购。Kaggle是全世界数据科学爱好者的第一站,他们争夺奖项并提高他们的Kaggle排名。到目前为止,世界上只有94位Kaggle大师。
你知道吗,大多数数据科学家只是理论家,很少有机会在受雇于现实世界之前进行实践?Kaggle通过给数据科学爱好者提供一个互动和竞争解决现实问题的平台来解决这个问题。你在Kaggle上获得的经验是非常宝贵的,可以让你准备好理解为大数据寻找可行的解决方案的内容。
Kaggle使数据科学家和其他开发者能够参与运行机器学习竞赛,编写和分享代码,并托管数据集。在Kaggle上发布的数据科学问题的类型可以是任何东西,从试图通过检查病人的记录来预测癌症的发生,到分析电影评论所引起的情绪以及这如何影响观众的反应。
不同的来源在这个开拓性的平台上发布项目。虽然有些项目只是出于教育目的和有趣的大脑练习,但其他项目则是公司试图解决的真正问题。Kaggle通过为获胜者和参与者颁发奖金和排名,使环境具有竞争性。奖品不仅是金钱,还可以包括有吸引力的奖励,如工作或主办比赛的公司的免费产品。
现金奖励对大多数Kagglers来说是令人兴奋的。例如,家得宝公司在寻找一种改善homedepot.com上搜索结果的算法时,提供了高达4万美元的获胜奖金。对于大多数数据科学爱好者来说,这个创新的网站不仅是一个金钱资源,而且也是一个不可或缺的学习工具,有助于改善经验,获得知识,提升和加强技能,并通过重新提交代码从错误中学习。它是一个完美的平台,可以持续练习。
Kaggle社区正在快速发展。目前有超过一百万的Kaggle成员(Kagglers)。这个数据社区已经向不同的比赛提交了超过400万个学习模型。Kaggle用户已经分享了一千多个数据集,超过17万个论坛帖子和250多个内核。根据创始人的说法,这种令人难以置信的快速增长可以归功于Kaggle用户所分享的高质量内容、数据和代码。
大多数Kaggle用户都很投入和活跃,因此每月有4000个论坛帖子,每天有超过3500个竞赛提交。这个平台是全球数据科学家和机器学习工程师的必争之地。
为什么Kaggle值得你花费时间?
有趣的、具有挑战性的项目,贡献者可以在这里学习和实践
Kaggle竞赛涉及解决具有挑战性和有趣的问题。公司向众多贡献者发布项目。对于那些刚想进入数据科学领域的初学者来说,它尤其是一个好地方。除了对公众开放的比赛外,Kaggle还有只对顶级参与者开放的私人比赛(Kaggle大师)。
与行业领袖和学识渊博的专家进行有见地的讨论
除了项目之外,Kaggle还包括平台上众多人之间的现场讨论。这样的论坛非常有趣,具有刺激性和信息性。通过这些讨论,你既可以向他人寻求建议,也可以向正在处理你所了解的问题的人提供建议
Kaggle为其受众提供了一个进入世界上最大的数据科学社区的机会
这个平台受到世界上一些最大的数据科学公司的信任,如沃尔玛、Facebook和Winton Capital。在Kaggle上,数据科学家可以获得曝光,并有机会实时处理大公司面临的问题。虽然这不是一种保证,但总是有机会让公司留下深刻印象,从而进行招聘。
Kaggle的创始人
这个数据科学平台是安东尼-戈德布鲁姆(Anthony Goldbloom)的智慧结晶,他是一位28岁的杰出计量经济学专家。他的目标是通过众包将大型开放数据带给大众。根据Goldbloom的说法,Kaggle以一种有意义的方式将数据科学家和企业联合起来。他的概念最初在澳大利亚没有得到足够的支持,然后他决定搬迁到美国的硅谷。在最近的一次技术会议上,Goldbloom表示,他对在Kaggle成立之前公司无法获得的大量人才感到惊讶。
Kaggle是如何工作的?
比赛的主持人负责准备数据和准备手头问题的详细描述。为了让主办方更方便,Kaggle提供了额外的咨询服务,可以帮助准备数据,并以最好的形式描述问题。
竞争项目的参与者用各种技术提交他们的模型。所有的工作都通过详细的Kaggle脚本在平台上分享,目的是激发新的想法以达到更好的基准。在大多数Kaggle竞赛中,提交的作品会被立即打分,并在实时排行榜上明确公开总结。
竞争者不会得到一次解决问题的机会。在截止日期之前,参赛者被允许对他们的提交材料进行他们认为合适的修改。这激发了参赛者的动力,使他们不断创新,发挥创意,打磨他们的技能,以产生更好的、优雅的和有效的解决方案。允许修改也提高了准确性和精确性的水平。
当比赛的截止日期过后,主办方将奖金支付给获胜者。主办方拥有唯一的所有权和免版税许可,可以以任何方式使用获奖作品的所有知识产权。
获奖者是如何被选中的
主办方将根据参赛者在排行榜上的位置,对其进行筛选。他们的最终剧本,也是提交的剧本内容。大多数主办方会主动联系有实力的竞争者并安排面试。
Kaggle项目的含金量和影响力
Kaggle最大和最被认可的项目之一是Heritage Health的项目,它提供了300万美元的显著现金价格。Kaggle上举办的竞赛产生了深远的影响,如加强和促成最先进的艾滋病毒/艾滋病研究和改善交通预测。
一些内容丰富的学术论文已经根据Kaggle的贡献所产生的结果撰写和发表。从本质上讲,Kaggle为公司提供了从世界上最好的数据科学家那里寻求解决方案的机会,并让外部人员来审视他们试图解决的问题。
数据统计
数据评估
本站酷啦鱼提供的Kaggle都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由酷啦鱼实际控制,在2024 年 6 月 29 日 下午10:37收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,酷啦鱼不承担任何责任。