服务器用的两台 dell poweredge 2850(机器可挺破)。每台配置是 2 颗 3g 的超线程 cpu 加上 8g 内存。存储是 raid 5 方式。共有 4.3t 内部(? 这个机型最大支持 1.8tb scsi 内部存储,其余就需要接外部存储了啊? )磁盘空间可用。没有说具体的存储设备或是连接方式。划分了 700g 给当前用。其余留作扩展。写了一个简单的脚本定期从 os 端检查磁盘状态。
操作系统用的红帽子 rhel 3 update 2。内核是 2.4.21-37.elhugemem ,能够充分利用大内存。接下来的设置我有一点疑问。前面说的 700g 空间挂在目录 /u02 下,而 ses 软件安装在 /u01 下。这个目录是单个磁盘分区上的--这似乎是一个单点啊!
oracle sga 设置了 2.5g 左右。当前已经索引了 35 万篇文档,数据库大小是 15g,cache 文件 17g,log(搜索的log) 文件 1g。如果 oracle 不做站外搜索的话,4.3 t 的总空间是绰绰有余。其实我倒是觉得 oracle 有义务对站外的 oracle 论坛等相关信息作一下专门的搜索,也算是对广大用户负责的一种手段。
负载均衡设备选用的是 f5(青春偶像 f4 的旁边, 呵呵)。示意图如下:
最后的监控方法也值得借鉴。
整个搜索站点构建中,软件成本的标准是: $30k/cpu 或者是 $60/命名用户 或是 $30/员工。两台机器上的 ses 需要 license 是 12 万美金。这个报价可不低啊。