Sep 222014
 

一般的企业,甚至所谓云计算公司,谈到云存储,第一想到的就是网盘。因为他们对这个是最熟悉。这个也没啥对和错。我想介绍和聊的云存储是国外类似AWS的S3,国内类似七牛这样的云存储厂商。

上周和七牛的朋友交流很长时间,头脑风暴一下,也对交流做一个总结。那么客户群体,有海量存储的需求,适合他们混合云的。下面谈到的云存储,是指S3类似的存储。

在国内,其实大家都有做平台之结,不过专门为了平台而去做平台,基本很难找到成功的案例,创业者去做平台,概率就更低了。中国人的麻将思想:中国人喜欢打麻将,盯着上家,卡死下家,自己不胡也不让别人胡。

这里主要还是讨论企业的场景。那些企业,有海量数据的需求。海量的数据,那么你至少都是PB级别吧。

技术现状

对于永久存放数据,确保可靠性。曾经和业内存储厂商交流过,他们的观点就是,300T左右,方案比较多,成熟,但是超过PB,其实谁心里都没有底气。其实仅仅讨论容量,也没啥意义,大文件的300T和小文件的300T,完全不一样。

如果企业的数据超过PB,那有啥选择呢。其实开源软件,Openstack的swift,HDFS,都是可以支撑PB级别,如果如何管理,出了问题如何解决,确保数据不丢失,还有提供良好的管理界面。这都是非常挑战的工作。

媒体制作公司

这个其实大家都可以想到。不过云存储适合的场景是数据的永久保存,肯定是不适合数据处理过程中的存储。媒体制作,对存储容量需求,是超过常人想象。国内某家号称自己的数据量已经快1000PB,我是非常不相信,咨询业内人士,答案是可能的,因为购买版权后,你会拿到全部的视频的材料,这个容量是非常吓人的。

有业内的朋友介绍过一个案例场景,大家看的电影,都是剪接而成,那么原始素材,容量是非常大的,尤其现在高清,更加可怕。不同的人剪接,效果很可能是不一样的。

对于媒体制作公司,难点不是在钱,而是在于如何让现在的各种工具,可以直接调用云存储,通过api去调用。这真的是第三方的机会。

视频监控

这个其实大家都可以想到,视频监控,其实数量很巨大。但是很难长时间保留。哪怕是一个超市的视频监控,其实数量都是比较可怕,一座大楼的视频监控。

即使在今天所谓的云时代,视频监控行业,还是比较原始。上次看交通新闻,说红绿灯下,出了事故,当时交警说,如果要调视频,需要隔一天才行。你是无法做到现场调阅。

很多超市,只能保存3个月的监控视频。但是很多信用卡案件,可能会让你调用6个月的。那么如何降低成本来存放更长时间的监控。

音频文件

那些行业有海量的音频数据呢?当然是呼叫中心。尤其是金融行业的数据中心。银行的信用卡全部业务,都是通过电话进行,所以音频的文件的存放,需求量是很大的。

大到什么程度呢?全国的信用卡数量,每人半个小时的通话,每分钟1m音频文件,那么算出来的结果是一个海量。

服务器日志

在AWS下有一个这样的应用,做了一个syslog插件,让服务器直接把log发送到S3的服务器,你可以直接通过web来查看这些log。

服务器的日志,是非常海量,你很难评估是否有用,你1年前给人黑了,你现在才发现,结果发现日志已经没了。那么这些海量的日志,你也是需要找地方存放的。

医疗研究行业

以前研究国外对象存储的用户群体,发现很多都是医疗行业,很多专门针对医疗行业的解决方案。Dell当年其实就收购了一家专门做医疗行业云存储的公司。

无论是医院,还是医疗的研究机构,他们的数据存储都是很惊人。一般技术人员,不会对医疗行业很了解。

对于医院来说,病人的拍的片,数据量是非常大的。做药品研究的,据说要保留的实验数据,也是很惊人的。

  4 Responses to “闲聊云存储用户群”

  1. 确实,我们有个客户是监狱,他们的项目就是录制所有的探访记录,数据也是海量啊

    • 不错,提供了一个很不错的思路。确实是海量的视频需求。我想不仅仅是探访记录,还有所有犯人在监狱里的记录。

  2. 大部分的用户案例,都是大量的数据大概率永不再使用,只有非常少量的数据才会再次被查询。对于这种情形,最好的存储方式就是图书馆方式 — 把数据存储在低成本长期存储设备上,分类编号,放在仓库的架子上,有需要时再根据索引人工查询。

 Leave a Reply

(required)

(required)