一、赛事主题
► 赛事名称:“隔镜杯”数据爬虫开发大赛
► 主办方:上海隔镜信息科技有限公司
► 协办方:上海交通大学软件学院
► 独家战略媒体:算力智库
► 合作支持:SegmentFault 思否 / 早起Python / 进击的Coder / MobTech 袤博
二、大赛简介
“隔镜杯”数据爬虫开发大赛,是隔镜科技联合上海交通大学软件学院举办的创意开发大赛,旨在为开发者和数据爬虫爱好者提供一个有趣的框架平台,尽情表达关于数据的灵感。
本次开发者大赛的主题为“让数据回家”,主办方希望通过本次比赛,激发参赛者关于个人数据主权的创意,我们鼓励参赛者通过爬虫技术,将自己的个人数据从互联网拿回自己手中,并基于这些数据开发各类有趣的应用,做数据的主人。
三、赛事日程
► 报名启动:6 月 29 日
► 报名 & 作品提交截止日期:7 月 22 日 22:00
► 评比公布:8 月 7 日
四、如何参赛
1、报名方式
► 关注公众号 我的数据百宝箱(微信号:mydatabox),回复“报名”,获取报名链接
► 通过社区论坛( https://mydata.homes )置顶链接报名
2、加入大赛技术协作交流群
► 添加大赛客服微信:mydatahome,回复“开发者+姓名”,加入大赛技术协作群
3、准备作品
► 首先想到一个关于个人数据采集的好点子;
► 我们准备了一个简单的框架和一些爬虫样例,我们希望您fork我们的爬虫代码库( https://github.com/MyDataHomes/Spider ),并基于此进行创作;您也可以选择其他语言和框架进行开发。
► 完成的作品应当具备完整可运行的代码、测试用例、使用文档、项目介绍材料(可以包括文档、PPT、视频等)。
4、提交作品
► 确认已经完成了报名流程(提交了团队信息,并且同意了参赛协议);
► 确认比赛作品已经完成,并且可以通过阅读项目README文档获取所有资料。如果是私有库,请确认已经给官方账号(id: MyDataHomes)添加了阅读权限;
► fork本仓库,拷贝作品提交模板( https://github.com/MyDataHomes/GeJing-Cup )来创建一份副本,仔细阅读模板并填充团队和项目信息,注意不要遗漏必填项,也不要修改其他任何文件;
► 重命名为 团队名称.md;
► 发起一次pull request完成作品提交申请。
五、参赛规则
1、组队要求
► 个人或自由组队参赛,每支队伍不超过3人,每人只能参加一支队伍,以队伍参赛须确定一名队长,便于后续赛事联系和通知;
► 参赛选手报名须提供真实联系信息。
2、参赛作品
► 作品内容:爬虫工具(含源代码、使用文档、测试用例等),作品介绍材料;
► 作品要求:
- 进行爬虫工具的开发,爬虫工具能够帮助用户抓取自己的个人数据,抓取的数据源类型不限(如淘宝、京东等);
- 参赛者可基于爬虫工具获取的数据,自主进行数据应用的设计,本要求为可选项; 参赛作品可基于比赛指定Github项目( https://github.com/MyDataHomes/Spider )进行开发,也可自行开发;
- 参赛作品的开发语言不限;
- 作品介绍文档需涵盖爬虫算法思路、实现方法、爬虫运行与测试方法、数据应用介绍(如有)等,介绍文档格式不限。
3、评审标准
由来自隔镜科技、上海交通大学软件学院以及其他机构的专家评判打分,评分标准如下:
► 爬虫评分(100分)
- 爬虫性能(40%):包括爬取数据的完整度、性能,爬虫鲁棒性等指标。
- 代码质量(30%):包括代码撰写是否规范、接口定义是否清晰、注释是否完整等。
- 创新性(30%):包括在数据获取方式、爬虫算法设计等方面的创新等。
► 附加分(20分)
- 用户界面(10%):良好的用户界面设计,操作方式、风格等方面具有创意和美感。
- 数据应用(10%):数据应用的实用价值、创新性等。
六、获奖制度
1、奖金预设
- 一等奖(1支队伍):10000元 + 证书;
- 二等奖(3支队伍):5000元 + 证书;
- 三等奖(6支队伍):2000元 + 证书;
- 优秀奖(若干):将根据实际参赛队伍数量确定优秀奖名额,将获得神秘礼品。
2、开源爬虫奖
- 对于基于GitHub项目( https://github.com/MyDataHomes/Spider )开发的爬虫工具,主办方将挑选优秀作品提交至Github项目库中,被选作品将获得“开源爬虫奖”,并获得神秘礼物。(本奖项与前述奖项不冲突,可同时获取)
本活动最终解释权归主办方所有!
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。