数据标注任务平台堂被调查导致平台任务都做不了吗

数据堂 这个公司的营利方式是什么呢? - 知乎95被浏览13321分享邀请回答.cn/upload/disclosure/-28/_000346.pdf然后介绍一下数据堂://插播一下数据的重要性:有人说过:一个经过大量基础数据集训练的劣质算法,表现会超过一个经过少量数据集训练的优质算法,这就是基础数据集的重要性。数据堂相当比例的数据就是被用来做基础数据集提升各个厂家算法的。数据堂给自己的定位:主要涉及的业务:(1)有一个自己的数据商城:用来出售自己或者他人的数据、API接口等。(2)根据客户要求,量身手机数据。(3)将自己收集的数据集、或者与别人合作的数据集/API放到自己的数据商城上面出售。不涉及的业务:不涉及如何使用具体的数据。例如:数据堂自己在卖用户语音类的数据,但是它自己不做如何把这些语音数据应用到具体场景中的事情。详细点来说如下:数据堂的意思是做一个基础数据的提供商,它有一个自己出售数据的平台/商城,它可以通过自己的众包模式采集数据,然后放到这个平台上面出售(即:“数据定制”);其次,更多的情况是它和别的数据拥有者合作,通过帮助这些数据拥有者对数据进行分类、编辑、清洗、去隐私等,然后直接把这些数据放到平台上出售,或者让这个数据提供商开放API接口,然后数据堂在自己的商城出售这个API接口。例如:用户购买了这个API之后,就可以实时查看某城市实时的拥堵情况。竞争力:(1)目前数据堂网站上面有一些比较好的资源,大部分都是和政府机构相关的,这么来看公司的业务拓展的还不错,路子还不错,这可以算是一条目前主要的优势。(2)先发优势:现在公司宣传的很好,大家都知道买数据就去数据堂,有了一定的先发优势。(3)真心没有看到数据堂有什么其它的核心竞争力了,会炒作?能吸引到投资?能上新三版?现在很有钱?这些勉强算是一条吧。威胁:先看一下目前国内的同行吧(1)各地方政府成立的交易所:贵州大数据交易所、湖北长江大数据交易所、陕西西咸新区大数据交易所等等等。(他们的业务也都是面向全国的,都有政府在后方支持,尤其是“贵州大数据交易所”,这个交易所集合了全省的行政力量在做)(2)产业联盟性质的交易所:中关村数海大数据交易平台(由中关村大数据产业联盟成立,算是半官方)(3)互联网综合数据交易和服务平台:数据堂等。具体来看:(1)近期威胁——全国各地政府纷纷成立大数据交易所:成立后就背负着赚钱的任务,所以之后政府方面的数据会更多地在这类官方平台上出售,干儿子毕竟干不过亲儿子,数据堂竞争力的第一条会慢慢削弱。(2)中长期威胁——国家开放数据大战略:国家层面的开放数据是一项必然的趋势,现在政府各个部委也在推进,虽然这是一个非常缓慢的过程,但是对于数据堂而言,这是致命的。因为就数据堂的定位而言,数据堂没有什么核心技术,很类似京东、亚马逊等电商平台的初期,现在主要是市场竞争小,而且数据堂又能拿到独家的货源,所以比较牛,但是一旦货源都放开了,就会比较被动。出路:(1)不断的融资砸钱做规模:随着数据贩卖市场的发展,当数据堂能在这个过程中占据比较大的市场份额后,即使一直在赔钱,只要有增量,就可以做下去,很类似现在淘宝天猫的模式,用户量达到一定的水平后,单靠广告费也能活的很好。(2)专注于差异化:什么都卖的这种数据集市是很难走下去的,只有注重差异化,就目前来说,或许只有走好数据定制这条路,才能长久的生存下去。不知道这个公司内部的工作环境怎么样,公司最大的出路在于领导。一位高瞻远瞩、掌握好资源的胜过上面的各种烂分析。数据堂主要业务板块:网上商城数据来源:(1)数据定制:具体包括下面三部分:
(a)众包平台:
(b)众标平台:
(c)众爬平台:这个目前还停留在概念阶段。刚注册去看了看,功能都不完善,目前公司宣传的众包平台还有很长一段时间要走。(2)与其他机构合作:从其他机构买断数据集、与其他机构合作分红API和数据集网站:集团网站:,旗下产品网站:(1)数据商城:旧网站;新网站:;(2)数+:(3)众课堂:算了,这几天好懒,暂时不想更了…2223 条评论分享收藏感谢收起15家大数据公司被调查,行业面临大清洗? | 晶睿互动
15家大数据公司被调查,行业面临大清洗?
|分类:|标签:&&&
下一篇:没有了
新媒体整合营销
线上互动活动策划管理
口碑传播/新闻传播/公关传播
微信微博运营/微信微博营销
媒体采购/SNS平台推广
网站数据统计/分析/挖掘
BS端应用系统/B2C解决方案
响应式/MiniSite主题
iPhone/iPad应用程序
Android应用程序
上海直通电话 021- 全国免费电话 400-011-5378还没有账号?
千亿数据堂猜想
温淑萍 08:46
经济观察报记者 温淑萍 齐红威,自认为不是一个单纯的技术男,游走技术江湖14年,但始终情寄&商海&。
5年前,彻底告别技术,贴上创始人这一商海新型标签。也就是2011年,他创办的以综合类大数据服务为主的数据堂在中关村诞生。2014年,成功挂牌新三板。
仔细研究发现,这一以人才为主导的领域,数据堂出众的看家本领有两个:一个是非结构化数据处理技术,另一个是大规模数据处理技术。而这两项技术与经验密不可分。或许这就是齐红威骄傲的根源所在,&我从上学到NEC工作,在技术领域摸爬滚打了14年,有时单次处理的数据中信息量达10亿条。&齐红威呵呵的中性开朗笑声印着洁白的牙齿舒展开,一张国字脸上架着一副近视镜。
在数据处理领域,一定程度上拼的其实不是处理了多少量级的信息,而是看在处理了大量极的信息后精准率的程度,现在数据堂可以高达90%。而其它的数据处理精准率有时只在50%到60%左右。
据了解,齐红威是中国第一批涉足数据业务的人,而他的创始团队,也都曾被认为是中国数据塔顶端的人士。
就像当年人类发现石油一样
眼下,或许真的可以称为是一个数据的时代,各类大数据被开发,实现交易现实的运用。如医药领域的大数据,大型药企巨头,针对于癌症领域,进行患者大数据的搜集,以便准确研发靶点新药,从而防止20年、20亿美金的无效浪费。在大数据领域,这一类被称为专业领域。而数据堂做的是社会类综合数据,其中包括,交通、健康、征信、智能即人工智能数据、O2O即纯衣食住出行数据。在这些领域,数据堂进行广范围数据抓取、挖掘、研究、分析后,提取信息价值,再出售给数据应用企业。
数据堂以人为核心的、辐射开来的数据挖掘,在业内被称为综合大数据服务商。随着商业市场的变化,精准定位消费者、提升企业原有经济价值等等正在成为更多企业的商业需求。因此数据处理类企业正在迅速走红。
与5年前相比,数据给人的影响,有着天壤之别。
齐红威中科院自动化所博士毕业后进入日企NEC中国研究院,做数据研发。那时,数据还是一个抽象的概念,价值没人懂,或者说对人们的生活没有起到影响作用。收集数据也是极其困难的一件事。
当时,齐红威在做交通数据信息收集时,为了拿到实时路况数据,找北京1039广播台合作,&那时,他们大部分数据没有播报,也就是说这些数据都没有用起来,最后闲置,时间久了都浪费了。&齐红威觉得,这其中的价值在被严重低估和浪费,如果开发会有无可估量的经济价值。
一边是无意识地浪费,一边是急切地需求,这其中便是商机。2000年左右,丰田找到NEC寻求帮助,当时丰田轿车在美国发生刹车门事件后,丰田很想知道整个车的用户评价,便于改进。NEC通过数据挖掘给出了建议。同样,大众迈腾,新款车尾被众多车主抨击缺乏美感,齐红威团队通过数据收集、分析后给出了改进建议,而此举也使得大众迈腾在之后的销售中一路冲锋向前。&数据对于企业来说,能产生巨大价值。&齐红威深深觉得,将来这绝对是一个大市场。
那时他最直观的感觉是,就像当年人类发现石油一样,一种资源孕育在那,还没有开采出来,但很明白这绝对是好东西。&数据,相当于小麦,收集一堆小麦&&各个行业的数据,处理后将小麦加工成面粉,然后再把面粉卖给做面包、做汉堡、做披萨的人,也就是做数据应用的那帮人。&齐红威觉得,这是个好生意,随着信息化的发展延续时间将会很长。他决心,给做面包、做汉堡和披萨的人提供面粉,让这个层面的商人在基础用料中不再困难。
时间推移到2011年,互联网化的社会发展趋势已经开始显明,且互联网公司不断成长起来。&我们做数据的有感觉,这个时候已经是围绕数据做业务的前期萌芽状态了。&齐红威称。
日,四人组成的创业团队,用100万,正式将数据堂落地中关村。
据齐红威以及多位投行称,数据堂是诞生最早的专业数据服务企业。
其在2011年9月成立,到2012年,是市场布局的阶段。2012年,数据堂业务收入达几百万,初步实现盈亏持平。2013年,实现盈利300万左右。这一年,数据堂推出众客堂,实现社会人士参与贡献数据的数据采集模式,到目前已经积聚了约60万人参与。随后又推出了征信服务。到2014年,盈利千万。据投行估算,数据堂2015年的收益更加客观。
数据堂的成功,一半是踏上了时代的列车,另一半或许和其的业务核心竞争力有关。数据堂的看家本领有两个,一个是非结构化数据处理技术,另一个是大规模数据处理技术。
非结构化数据处理技术包含:图像理解、语音识别、语义理解等。这三个技术中,图像理解对应的是视频和图像,语义对应的大量文字。尤其是现代社会中,80%的数据是以非结构化数据形式存在,如微信、朋友圈的图像、小视频、一段语音。
大规模数据处理技术,指的则是规模达到PB级的信息数据。通常如果按一个笔记本500G容量算,PB级的数据规模约相当于2000多台笔记本的容量。在这一领域中,对于大规模数据处理,拼的不是建立一个大的云平台,多拉几百台笔记本同时处理,关键的是连接几百台笔记本的控制软件的平台,实现调度和管理几百台笔记本的软件,如果这一技术不过关就会出现数据不精准的情况。在一些数据处理商中,常出现的情况是,几百台笔记本处理后,合并信息、提取价值时,却出现差异,使得精准度只在50%左右。
齐红威在NEC 时,曾在一次项目中,联系了汽车之家、爱卡、搜狐汽车频道等,从15亿篇评论中抽取数据,而一篇评论有时可能就达2000字,各类的评论观点都容积其中,比如此次主要抽取油耗、外观的数据,那么就需要从这15亿篇贴子中抽出40亿个评论点,然后再去信息归类。如其中一个网友一条评论称,昨天刚去买的kk,倒车时不小心撞了树脂,挂掉了一层漆,kk汽车漆很软,信息归类后既显示为:&车系:丰田;车型:凯美瑞;用户评价部件:车漆;评价倾向是:车漆不好。&也就是说,大数据的处理既是将这样数亿篇帖子的信息集中处理。
而部分数据商处理的情况是10亿篇语义,分析出来5亿篇,那么精度只有50%,精度太低。
这些数据的处理都依赖机器,机器的技术又依赖于人。可以说,这是一个较为依赖于人才的领域。
齐红威此前供职的NEC是全球顶尖研发机构,在全球来说,当时并肩的也就是微软、IBM。而NEC当时是以大项目集成为核心业务之一,包括大项目的总体解决方案。共电信、汽车,业务最强。IBM最强的是银行业。
当时,齐红威在NEC逐渐升职为管理人员,牵头做一个跨全球的项目。&NEC中国研究院牵头,是一个大规模的数据处理平台项目,非结构化处理技术的集成,当时里面有的图像技术我是从日本拿过来的,文本语义理解是中国研究院,语音是德国研究院那来的,这样集成的模式来做,术业有专攻,大家专长不一样,他们的语音的核心处理技术,美国是图像强。这一项目落地后,使用到了丰田汽车的项目中。&他说。
齐红威创始人团队中,丰强泽,是他的同事,齐红威负责管理团队,而丰负责技术。另一个创始人,肖永红,在中科院,有多年的客户解决方案和咨询的经验,市场经经验丰富。另一位是飞信变革的掌控者柴银辉,在互联网产品运营和规划在业内比较知名。
&天鹅融资&
在合作伙伴的评价中,对齐红威有一个共同的认识,即&他聪明,有技术男的踏实特质。&&我始终认为,这个世界是属于知识分子的。齐红威能创始数据堂,并推上新三板并非因为他聪明,而是因为他的知识结构为他这个技术男寻找到了另一个人生的出口。&京东金融一位与齐红威接触过的人士认为,齐红威当年要做的是没有人发现且不愿进入的,而齐红威涉足了。
2014年1月,数据堂获得1300万天使轮融资。
当时,市场的天使轮大都在300到500万额度间,投行界认为数据堂的这轮融资不能叫天使,应该叫天鹅,因为天使没有这么胖。&
天使轮是由国家发改委和北京发改委的一个产业基金,以及云基地田溯宁组成的投资。投资方认为,大数据将来是支撑产业发展、提升现有经济价值的有力依据,因此要提前布局。
获得天使轮融资后,微胖的天鹅振翅腾空,同年12月,顺利挂牌新三板。到今年5月份,完成A轮融资,达晨创投加天使轮追投,共达5000万融资额。
而短短7个月,11月6日,数据堂对外再度宣布完成B轮融资,融资额为2.4亿元。&虽然目前没有竞争对手,但不得不考虑这个领域也会突然杀出一个柳青来。&齐红威认为,快跑,让别人追不上,直至无法追赶,到高高的山上歇一歇时才有安全感。
大量资金需求的背后,事实上是齐红威谋划的深度布局。据其介绍,目前员工150人,到春节会冲到230人。据了解,目前150人中,技术出生的占到了总人数的一半。虽然齐红威拒绝透露市场规划,但目前的布局看,未来或将会向密集型深化。目前,数据堂在镇江、南京、天津分别设有一个子公司,在美国硅谷设有一个全资子公司,并特设了一家征信子公司。
在业务渗透方面,数据堂打算做云图,并孵化创新型的中小企业。这个层面来说,由于垂直层面落地,需要的行业数据将更加广泛和庞大。&到最后,数据堂表面上呈现的是,一个类似于淘宝、京东卖数据的电商平台。背后,是深度垂直的企业服务。&北京一家投行人士认为,这也预示着未来信息的商业价值最大化。&现在大数据时代,我个人认为2015年算是元年,已经开始了,前年是准备,除了先知先觉的有一些人先发优势在做,真正大规模爆发是今年,明年还会大爆发,后年可能还会更大,但现在整个大数据产业刚刚开始。拿万里马拉松来形容,我觉得刚跑到1000米,最多1500米,一切真是刚刚开始。&齐红威称。
在这个即将大爆发的商业浪潮中,投行以及多位互联网人士认为,将会有万亿市场空间。如马云的淘宝每年的大数据销售额有数百亿,同样京东的数据销售额也很可观。如果将交通、医疗、物流、食品、教育、婴幼儿等等任何一个产业算起来,都将释放巨大的市场空间。商务部规划纲要中称,未来,大健康产业空间是8万亿,而其中大数据的出现和应用必将延伸产业链,并提升现有企业转型和产品改进,因此包括电商在内,大数据释放的空间或超过千亿。
&国务院出台的大数据纲要,包括最近又出台的互联网发展思路,无论从企业还是个人生活讲,这些数据都可以起到提升效率的巨大作用。从微观来讲,数据堂每年都是三四倍甚至五六倍的速度增长。&齐红威深信,大数据市场未来前景可观。
目前,数据堂的资本市场估值为20亿,据多位投行人士分析,未来数据堂或许会伴随着中国大数据的应用化发展,成为千亿市值的综合大数据公司。&一方面是数据堂本身规模的扩张,数据业务的扩充,得到重新估值,另一方面是再度融资而实现市值快速提升。&交通、物流、医疗,这三个本身就是大市值领域,如果数据堂发展跟得上,拥有的数据资源够质量,快速提升估值是必然的。&一位投行人士称。
这位人士也认为,随着大数据热潮的爆发,未来将会出现其他大数据服务企业,届时或会冲淡数据堂目前的先发优势。那时,比拼的或许就是数据的质量。以及数据的大广泛性。
经济观察报 公司部大健康Lab主任、资深记者
关注医疗服务、医药产业、医疗器械新科技、食品等大健康围绕的生命科学领域的新趋势、新变化、具核心竞争力的企业变化;擅长调查、深度、人物特写等报道。
微信公众号:大健康Lab
你可能还想看
地址:北京市东城区安德路47号院甲11号
邮编:100011 电话: 传真:86-10-
鲁ICP备号 京公网安备06号
Copyright ? 经济观察网}

我要回帖

更多关于 oracle数据库定时任务 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信