如果自己搞不定可以找诗檀软件专业ORACLE数据库团队成员帮您服务!
诗檀软件专业数据库团队
服务热线 : 13764045638 QQ号:47079569 邮箱:[email protected]
项目背景
- 现状:目前在用的HIS系统由3台P550Q小型机、1台IBM DS4800存储和1台EMC VNX5500存储组成,其中2台P5 550Q运行Oracle 10g RAC环境,另一台P6 550Q(租借)通过Oracle Dataguard实现异地灾备。
- 问题:HIS系统运行至今已6年多,设备已到生命周期的后期;存储存在单点故障;主机全部部署在门诊楼机房,存在单机房故障风险。
项目目标
- 消除硬件风险:完成设备更新,消除设备老化带来的故障高发风险。
- 完善HIS架构:消除存储单点故障,实现高可用和容灾的终极目标。
- 锻炼HIS运维团队:我院HIS运维团队相对比较年轻,在工作经验、技术水平、项目管理、沟通协作等方面具有很大上升空间,特别是通过大项目的历练,可以加快提高人员素质,对个人、对单位都具有很大好处。
HIS架构完善需求
根据业务分级标准,HIS系统归为Ⅰ级(平均非计划停机时间:99.999%(5分钟)计划停机:1次/季度),系统架构上采用双机房双机双活,灾备模式上采用热备/同步,服务器采用P+P+P小机,在线存储采用2台高端存储,灾备存储采用1台中端存储。
为实现上述目标,本项目需匹配相应的硬件设备和高可用、容灾技术。
数据库需求
2.2.1 数据库容量需求:
- 支持5年数据库容量
- 在线数据保留1年半,超出部分做数据转储。
注:目前采用传统的手工转储方式,误操作风险高,费时费力。明年规划引入“自动化数据转储平台”。
2.2.2 数据库版本需求
目前甲骨文公司已经停止对Oracle10g的技术支持。Oracle最新版本为12C,但是市场占有率不高,存在不稳定因素。Oracle11g为市场上较稳定版本,成功案例众多,因此建议升级到Oracle11g。
2.3 操作系统需求
现有AIX版本为5.3,但是IBM公司已经停止对该版本的补丁升级。AIX最新版本为7.1,但是同Oracle12C一样,市场占有率不高。经多方咨询,建议升级到AIX6.1。
1、 架构设计方案
3.1 HIS总体架构设计
为了实现HIS架构完善需求,经过反复论证,最终形成的HIS总体架构如下图所示。
小型机:
- 两台IBM P740小机分别部署在门诊楼和综合楼机房,通过Oracle RAC计算实现双活及负载均衡。
- 一台IBM P740小机部署在综合楼机房,利用Oracle Active Dataguard技术实现数据库实时灾备。灾备库部署在医联项目购买的EMC VNX5500存储。
- IBM P740灾备小机Oracle库开启实时查询功能,供报表类业务使用。
- 利旧小机做教练库、历史库、恢复测试库使用。
存储:
- 两台EMC VMAX10K高端存储分别部署在门诊楼和综合楼,通过Oracle ASM技术解决存储单点故障。
- 为了不占有高端存储资源,Oracle RMAN备份存放在Isilon。
数据保护:
- 规划部署一台CDP设备(单独立项),实现0-48小时数据库任意时间点回滚。
3.2 架构详细设计
HIS总体架构落实到硬件层面上可分为:小型机、存储、SAN网、心跳网和IP网,如下图所示。
.2.1 小型机
3.2.1.1 AIX操作系统
- AIX系统建议使用较稳定的1版本
- 不使用POWER VM
- JDK&JRE版本为IBM JDK 1.6.0.00 (64 BIT)或更高
- 启用操作系统Large Page特性
- 暂时打1 TL8 SP4(最新补丁为TL9,由Oracle服务公司和IBM共同商量是否需要打TL9)
详见:AIX操作系统安装文档(由安富利公司提供,ORACLE服务公司终审,待整理)
3.2.1.2 小型机硬件配置
- P740的4块硬盘规划:2块组建Raid 1,2块配置成hotspare
- P740网口绑定ether channel,模式为active/standby
详见:IBM P740配置方案(由安富利公司提供,ORACLE服务公司终审,待整理)
3.2.2 存储
3.2.2.1存储容量及生命周期规划原则
- 一次性规划到5年容量,并预留20%的安全容量(预防爆发性异常数据增长)
- 如初始购买容量不够,则按照3年规划。3年后,建议再扩2年容量
- 5年后,存储进入生命周期后期,建议评估更换(如果不能更换,建议再扩2年容量)
- 7年后,存储已经进入故障高发期,建议必须更换
3.2.2.2 VMAX存储
由于HIS生产库存放在两台VMAX存储上,因此需要评估现有存储容量可以支持几年的数据量。另外,由于配置了SSD固态硬盘,也需要制定其使用场景。
(1)VMAX存储现有容量
- 可用容量:总共52块600G SAS,4块热备盘,可用48*600G,做ASM+RAID1,可提供约12TB空间(实际容量=理论容量*0.9)。(5块400G SSD,1块热备盘,RAID1,可用800G。)
- 两份克隆:规划提供两份1:1克隆数据(已确认只能克隆到自身),供教练库和EXPDP逻辑导出库
(2)生产数据库容量需求估算
截至2014年12月,HIS全库大小为227GB。业务增长率以每年门诊人次为参考,平均每年12%,新业务增长率为10%。下表规划到2019年12月,总共五年。
生产库容量为表中的数据文件+归档日志文件。由于RMAN备份文件放在NAS,因此不占用VMAX存储容量。
从表中可以估算出3年生产库容量约为。
按照计算公式:存储容量需求=生产库+克隆+预留20%安全容量(12TB*0.2=2.4TB),评估VMAX存储可以支持几年的数据量。
(3)3年存储容量需求评估
3年存储容量需求=生产库+克隆+预留20%安全容量=3TB+6TB+2.4TB=11.4TB < 12TB
得出结论:现有VMAX容量可以满足3年存储容量。
(4)5年存储容量需求评估
5年存储容量需求=生产库+克隆+预留20%安全容量=5TB+10TB+2.4TB=17.4TB > 12TB
得出结论:现有VMAX容量不能满足5年存储容量。
因此,按照3年存储容量,对VMAX进行空间划分。
(5)VMAX扩容规划
- VMAX扩容能力
VMAX在不加磁盘笼子的情况下,还能扩展42块600G SAS硬盘;再加磁盘笼子的情况下,最多可扩展到2000块600G SAS硬盘。
- 第一次扩容:
3年后需扩容6TB(17.4TB-11.4TB)到5年容量。每台存储增加12块600G SAS硬盘(4块一组),加上实施费,经询价,约需经费45万元。(3年后视市场价格情况再调整)。
- 第二次扩容:
5年后,新设备如果不到位,再申请经费进行扩容,具体扩容方案及费用根据当时的市场情况评估。
(6)VMAX配置图
根据容量需求、ORACLE RAC心跳盘配置和ORACLE ASM配置需求,给出VMAX配置图如下。
对存储配置图的几点说明:
- REDO不建议放在SSD层中,规划放在SAS层,容量为2个50G。
- SSD适合存放的Oracle文件需专业ORACLE服务公司测试后才能定论(不影响架构规划)。
- VMAX本身不作为备份设备,采用相对廉价的Isilon作为备份设备。
- 每台存储划3个2G磁盘,两两做LVM镜像,实现RAC心跳的投票盘。
注:日后规划改为第3个机房的SAN存储作为投票盘。
- 根据Oracle经验,存储的LUN划分单位为200G。
- 容量划分明细如下表所示:
详见:VMAX存储实施方案(由EMC公司提供,ORACLE服务公司终审,待整理)
(7)ASM头的备份与恢复
- ASM Disk头部的100MB数据是ASM的元数据,若丢失则可能造成ASM Diskgroup的故障。
- 通过运行在操作系统上的脚本备份(每半个月备份,加减盘前必须备份!),可以将ASM disk元数据备份到文件系统上(建议备份到isilon)。
- 若ASM Disk的元数据受损,则可以通过该份备份迅速还原(具体使用Unix dd工具),快速修复ASM diskgroup。
- 待实施公司确定后,由其出具详细方案。
(8)操作系统、数据库、ASM、存储之间的关系
ASM视图(举例)如下:
VNX5500灾备存储
需要对HIS灾备存储VNX5500(医联采购)配置LUN,并映射给P740灾备小机使用。
详见:VNX5500灾备存储实施方案(由EMC公司提供,ORACLE服务公司终审,待整理)
3.2.3 SAN网
利用外围业务系统改造项目采购的4台SAN交换机组建的SAN网,来实现主机与存储之间的冗余连接。
详见:SAN网络实施方案
Leave a Reply