返回   华枫论坛 > ◆主题论坛◆ > 创业者俱乐部



发表新主题 回复
 
只看楼主 主题工具
旧 Oct 26th, 2007, 10:55     #1
ChinaSmileJoe
Senior Member
级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时级别:92 | 在线时长:8924小时 | 升级还需:97小时
 
ChinaSmileJoe 的头像
 
注册日期: Jul 2004
帖子: 79,350
积分:163
精华:102
ChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond reputeChinaSmileJoe has a reputation beyond repute
默认 【转帖】eBay 公司,数据量究竟有多大?

作为电子商务领头羊的 eBay 公司,数据量究竟有多大? 很多朋友可能都会对这个很感兴趣。在这一篇Web 2.0: How High-Volume eBay Manages Its Storage(从+1 GB/1 min得到的线索) 报道中,eBay 的存储主管 Paul Strong 对数据量做了一些介绍,管中窥豹,这些数据也给我们一个参考。

站点处理能力

* 平均每天的 PV 超过 10 亿 ;
* 每秒钟交易大约 1700 美元的商品 ;
* 每分钟卖出一辆车A ;
* 每秒钟卖出一件汽车饰品或者配件 ;
* 每两分钟卖出一件钻石首饰 ;
* 6 亿商品,2 亿多注册用户; 超过 130 万人把在 eBay 上做生意看作是生活的一部分。

在这样高的压力下,可靠性达到了 99.94%,也就是说每年 5 个小时多一点的服务不可用。从业界消息来看,核心业务的可用性要比这个高。

数据存储工程组控制着 eBay 的 2PB (1Petabyte=1000Terabytes) 可用空间。这是一个什么概念,对比一下 Google 的存储就知道了。每周就要分配 10T 数据出去,稍微算一下,一分钟大约使用 1G 的数据空间。

计算能力

eBay 使用一套传统的网格计算系统。该系统的一些特征数据:

* 170 台 Win2000/Win2003 服务器;
* 170 台 Linux (RHES3) 服务器;
* 三个 Solaris 服务器: 为 QA 构建与部署 eBay.com; 编译优化 Java / C++ 以及其他 Web 元素 ;
* Build 整个站点的时间:过去是 10 个小时,现在是 30 分钟;
* 在过去的2年半, 有 200 万次 Build,很可怕的数字。

存储硬件

每个供货商都必须通过严格的测试才有被选中的可能,这些厂家或产品如下:

* 交换机: Brocade
* 网管软件:IBM Tivoli
* NAS: Netapp (占总数据量的 5%,2P*0.05, 大约 100 T)
* 阵列存储:HDS (95%,这一份投资可不小,HDS 不便宜, EMC 在 eBay 是出局者) 负载均衡与 Failover: Resonate ;


搜索功能: Thunderstone indexing system ;
数据库软件:Oracle 。大多数 DB 都有 4 份拷贝。数据库使用的服务器 Sun E10000。另外据我所知, eBay 购买了 Quest SharePlex 全球 Licence 用于数据复制.

应用服务器

应用服务器有哪些特点呢?

* 使用单一的两层架构(这一点有点疑问,看来是自己写的应用服务器)
* 330 万行的 C++ ISAPI DLL (二进制文件有 150M)
* 数百名工程师进行开发
* 每个类的方法已经接近编译器的限制

非常有意思,根据eWeek 的该篇文档,昨天还有上面这段划线的内容,今天上去发现已经修改了:

架构

* 高分布式
* 拍卖站点是基于 Java 的,搜索的架构是用 C++ 写的
* 数百名工程师进行开发,所有的工作都在同样的代码环境下进行

可能是被采访者看到 eWeek 这篇报道,联系了采访者进行了更正。我还有点奇怪原来"两层"架构的说法。

其他信息

* 集中化存储应用程序日志;
* 全局计费:实时的与第三方应用集成(就是eBay 自己的 PayPal 吧?)
* 业务事件流:使用统一的高效可靠消息队列. 并且使用 Cookie-cutter 模式用于优化用户体验(这似乎是大型电子商务站点普遍使用的用于提高用户体验的手法)。

后记

零散作了一点流水帐。作为一个 DBA, 或许有一天也有机会面对这样的数据量。到那一天,再回头看这一篇电子垃圾。

(来源:DBA NOTES)
帅哥 ChinaSmileJoe 当前离线  
回复时引用此帖
旧 Oct 26th, 2007, 16:38   只看该作者   #2
googlebot
Senior Member
级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时级别:63 | 在线时长:4291小时 | 升级还需:61小时
 
注册日期: May 2006
帖子: 5,891
积分:4
精华:2
声望: 2095771
googlebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond reputegooglebot has a reputation beyond repute
默认

才170台服务器?

microsoft有4W台server, google有4w台server

我不太相信ebay才170台,不过ebay的搜索页面是慢
googlebot 当前离线  
回复时引用此帖
旧 Oct 26th, 2007, 16:53   只看该作者   #3
成心海味
Senior Member
级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时级别:23 | 在线时长:669小时 | 升级还需:3小时
 
注册日期: Jul 2007
帖子: 954
声望: 263549
成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute成心海味 has a reputation beyond repute
默认

偶去过谷哥在搭蜡丝的数据处理中心. 害怕被辐射半天就跑了.
这是她的数据库, 上面是液体冷却系统.

http://i.cmpnet.com/infoweek/galleries/automated/62/google7_full.JPG
成心海味 当前离线  
回复时引用此帖
旧 Oct 26th, 2007, 17:28   只看该作者   #4
多伦多市政府
退休市长
级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时级别:59 | 在线时长:3778小时 | 升级还需:62小时
 
多伦多市政府 的头像
 
注册日期: Jul 2004
住址: CANADA
帖子: 8,546
积分:4
精华:2
声望: 44862667
多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute多伦多市政府 has a reputation beyond repute
默认

我记得前两年看的介绍,MICROSOFT。COM 只有一百几十台服务器,
引用:
作者: googlebot 查看帖子
才170台服务器?

microsoft有4W台server, google有4w台server

我不太相信ebay才170台,不过ebay的搜索页面是慢
多伦多市政府 当前离线  
回复时引用此帖
旧 Oct 26th, 2007, 22:07   只看该作者   #5
格林威治
Senior Member
级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时级别:23 | 在线时长:639小时 | 升级还需:33小时
 
格林威治 的头像
 
注册日期: Jul 2005
帖子: 4,324
积分:5
精华:2
声望: 701820
格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute格林威治 has a reputation beyond repute
默认

引用:
作者: googlebot 查看帖子
才170台服务器?

microsoft有4W台server, google有4w台server

我不太相信ebay才170台,不过ebay的搜索页面是慢

我觉得也太少,1700差不多.
格林威治 当前离线  
回复时引用此帖
发表新主题 回复


发帖规则
不可以发表新主题
不可以发表回复
不可以上传附件
不可以编辑自己的帖子

启用 BB 代码
论坛启用 表情符号
论坛启用 [IMG] 代码
论坛禁用 HTML 代码



所有时间均为格林尼治时间 -4。现在的时间是 23:41

请尊重文章原创者,转帖请注明来源及原作者。
凡是本站用户自行发布的任何信息,皆不代表本站的立场,
华枫网站不确保各类信息的正确性和可靠性,也不承担由此而导致的任何直接或间接损失以及任何法律责任。

Copyright © 1999-2024 Chinasmile