[文章作者:张宴 本文版本:v1.1 最后修改:2008.07.17 转载请注明出自:http://blog.zyan.cc]
Citrix NetScaler是一款不错的4-7层硬件负载均衡交换机,市场占有率仅次于F5 BIG-IP,位居第二。NetScaler 8.0是美国思杰系统有限公司(Citrix Systems, Inc)正式推出的最新版本NetScaler产品系列。
从我的实际测试来看,NetScaler 8.0在七层负载均衡方面,性能和功能都要比F5 BIG-IP强。
NetScaler 8.0的负载均衡监控中,可以对MySQL数据库进行健康检查,而F5 BIG-IP目前只支持对Oracle和Microsoft SQL Server数据库的健康检查。
但是,NetScaler 8.0自带的MySQL健康检查脚本(nsmysql.pl)并不完善,它只能检查一条SQL语句执行是否出错,并不能检查MySQL主从结构中的MySQL Slave数据库同步是否正常、表有无损坏、同步延迟是否过大、是否出现错误、非sleeping状态的连程数是否过高等情况。于是,我根据自己的需要,为NetScaler 8.0写了一个MySQL Slave数据库负载均衡健康检查脚本(nsmysql-slave.pl),实现了上述需求。
有了“nsmysql-slave.pl”做健康检查,利用NetScaler的VIP(虚拟IP),就可以完美实现多台MySQL Slave数据库的负载均衡了。当一台MySQL Slave数据库出现不同步、表损坏、同步延迟过大(本脚本中默认设置的落后MySQL主库600秒视为延迟,可根据具体应用修改)、活动连程数太高(本脚本中默认设置的是大于200视为连程数太高,可根据具体应用修改)等情况,“nsmysql-slave.pl”就会自动将其检查出来,并告知NetScaler,NetScaler会将该数据库标识为宕机,从而不将用户的查询请求传送到这台发生故障的数据库上。故障一旦修复,“nsmysql-slave.pl”会自动告知NetScaler,该数据库已经可以使用。
“nsmysql-slave.pl”源代码如下: 脚本压缩包下载:
健康检查脚本写完了,现在开始配置NetScaler 8.0:
1、使用SecureCRT等SSH客户端工具登录到NetScaler,然后执行以下命令:
将“nsmysql-slave.pl”的源代码粘贴到其中,然后保存退出,再执行以下命令:
2、检查一下从NetScaler上是否能够连接MySQL Slave数据库:
Enter password:(在此输入MySQL登录密码)
ERROR 1251: Client does not support authentication protocol requested by server; consider upgrading MySQL client
如果你的MySQL Slave服务器版本高于4.0,就会出现以上错误。这是因为MySQL 4.1及其以上版本的密码验证算法与MySQL 4.0及其以下版本不同,而NetScaler 8.0上的MySQL客户端默认版本为4.0.25,因此,4.0.25版本的MySQL客户端连接4.1、5.X、6.X版本的MySQL服务器就会出错。
解决办法1:升级NetScaler 8.0上的MySQL客户端,但最好不要这么做,因为NetScaler与底层的FreeBSD系统和应用软件嵌入很密切的,不要轻易替换成非官方版本,以免导致不兼容、不稳定等情况。
解决方法2:在各台MySQL Slave服务器上新建一个名为“netscaler”的超级管理员帐号,将密码改为使用旧加密算法进行加密的密码。如果从安全考虑,可将以下语句中的%换成NetScaler的Subnet IP。
Server version: 5.1.24-rc MySQL Community Server (GPL)
Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
mysql>
3、各台MySQL Slave数据库必须添加允许NetScaler的Subnet IP访问的帐号,因为在同一网段,不能开启源IP支持,MySQL服务器上看到的将是NetScaler的Subnet IP:
例如:【Web服务器(192.168.1.21)】──→【NetScaler VIP(192.168.1.5)】- - - →【NetScaler Subnet IP(192.168.1.2)】──→【MySQL Slave服务器(192.168.1.31)】
MySQL Slave服务器看到的是IP地址是192.168.1.2,就需要添加NetScaler的Subnet IP访问的帐号('apache'@'192.168.1.2'):
Server version: 5.1.24-rc MySQL Community Server (GPL)
Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
mysql>
4、从Web管理界面登录NetScaler 8.0,进入Configuration页面(需要安装Java Runtime Environment,版本在JRE 1.4.x+以上):
5、点击【Load Balancing】──【Monitors】栏的“add”按钮,添加一个名为“mysql_slave”的MySQL健康检查:
①、Interval:正常情况下,10秒钟检查一次;
②、Response Timeout:每次检查的超时时间为8秒,必须小于Interval;
③、Down Time:宕机状态下,每5秒钟检查一次;
④、Retries:重试5次后仍然检查失败,标记服务器为宕机;
⑤、Type:选择MySQL;
⑥、Script Name:点击其后的“Browse...”按钮,选择我编写的MySQL Slave健康检查脚本“nsmysql-slave.pl”;
⑦、Dispatcher IP和Dispatcher Port必须填“127.0.0.1”和“3013”,不要改变;
⑧、User Name输入刚才创建的帐号“netscaler“,password输入创建帐号时设定的“12345678”。
6、点击【Load Balancing】──【Service Groups】栏的“add”按钮,添加一个名为“pool_mysql”的MySQL服务器池:
①、添加真实MySQL Slave服务器到“pool_mysql”服务器池,协议选择TCP:
②、健康检查方式选择第5步中创建的“mysql_slave”:
7、点击【Load Balancing】──【Virtual Servers】栏的“add”按钮,添加一个名为“vs_mysql_slave”的VIP(虚拟IP):
①、添加“pool_mysql”服务器池到名为“vs_mysql_slave”的VIP(192.168.1.5:3306),协议选择TCP:
②、负载均衡方式选择Least Connection(最小连接数):
8、Web服务器要访问MySQL Slave,只需访问NetScaler的VIP──192.168.1.5的3306端口即可。至此,已经完美解决多台MySQL Slave数据库的负载均衡问题。
Citrix NetScaler是一款不错的4-7层硬件负载均衡交换机,市场占有率仅次于F5 BIG-IP,位居第二。NetScaler 8.0是美国思杰系统有限公司(Citrix Systems, Inc)正式推出的最新版本NetScaler产品系列。
从我的实际测试来看,NetScaler 8.0在七层负载均衡方面,性能和功能都要比F5 BIG-IP强。
NetScaler 8.0的负载均衡监控中,可以对MySQL数据库进行健康检查,而F5 BIG-IP目前只支持对Oracle和Microsoft SQL Server数据库的健康检查。
但是,NetScaler 8.0自带的MySQL健康检查脚本(nsmysql.pl)并不完善,它只能检查一条SQL语句执行是否出错,并不能检查MySQL主从结构中的MySQL Slave数据库同步是否正常、表有无损坏、同步延迟是否过大、是否出现错误、非sleeping状态的连程数是否过高等情况。于是,我根据自己的需要,为NetScaler 8.0写了一个MySQL Slave数据库负载均衡健康检查脚本(nsmysql-slave.pl),实现了上述需求。
有了“nsmysql-slave.pl”做健康检查,利用NetScaler的VIP(虚拟IP),就可以完美实现多台MySQL Slave数据库的负载均衡了。当一台MySQL Slave数据库出现不同步、表损坏、同步延迟过大(本脚本中默认设置的落后MySQL主库600秒视为延迟,可根据具体应用修改)、活动连程数太高(本脚本中默认设置的是大于200视为连程数太高,可根据具体应用修改)等情况,“nsmysql-slave.pl”就会自动将其检查出来,并告知NetScaler,NetScaler会将该数据库标识为宕机,从而不将用户的查询请求传送到这台发生故障的数据库上。故障一旦修复,“nsmysql-slave.pl”会自动告知NetScaler,该数据库已经可以使用。
“nsmysql-slave.pl”源代码如下: 脚本压缩包下载:
下载文件
健康检查脚本写完了,现在开始配置NetScaler 8.0:
1、使用SecureCRT等SSH客户端工具登录到NetScaler,然后执行以下命令:
shell
cd /nsconfig/monitors/
vi nsmysql-slave.pl
cd /nsconfig/monitors/
vi nsmysql-slave.pl
将“nsmysql-slave.pl”的源代码粘贴到其中,然后保存退出,再执行以下命令:
chmod +x nsmysql-slave.pl
2、检查一下从NetScaler上是否能够连接MySQL Slave数据库:
mysql -u 用户名 -p -h 192.168.1.31 -P 3306
Enter password:(在此输入MySQL登录密码)
ERROR 1251: Client does not support authentication protocol requested by server; consider upgrading MySQL client
如果你的MySQL Slave服务器版本高于4.0,就会出现以上错误。这是因为MySQL 4.1及其以上版本的密码验证算法与MySQL 4.0及其以下版本不同,而NetScaler 8.0上的MySQL客户端默认版本为4.0.25,因此,4.0.25版本的MySQL客户端连接4.1、5.X、6.X版本的MySQL服务器就会出错。
解决办法1:升级NetScaler 8.0上的MySQL客户端,但最好不要这么做,因为NetScaler与底层的FreeBSD系统和应用软件嵌入很密切的,不要轻易替换成非官方版本,以免导致不兼容、不稳定等情况。
解决方法2:在各台MySQL Slave服务器上新建一个名为“netscaler”的超级管理员帐号,将密码改为使用旧加密算法进行加密的密码。如果从安全考虑,可将以下语句中的%换成NetScaler的Subnet IP。
Server version: 5.1.24-rc MySQL Community Server (GPL)
Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
mysql>
GRANT ALL PRIVILEGES ON *.* TO 'netscaler'@'%' IDENTIFIED BY OLD_PASSWORD('12345678');
FLUSH PRIVILEGES;
FLUSH PRIVILEGES;
3、各台MySQL Slave数据库必须添加允许NetScaler的Subnet IP访问的帐号,因为在同一网段,不能开启源IP支持,MySQL服务器上看到的将是NetScaler的Subnet IP:
例如:【Web服务器(192.168.1.21)】──→【NetScaler VIP(192.168.1.5)】- - - →【NetScaler Subnet IP(192.168.1.2)】──→【MySQL Slave服务器(192.168.1.31)】
MySQL Slave服务器看到的是IP地址是192.168.1.2,就需要添加NetScaler的Subnet IP访问的帐号('apache'@'192.168.1.2'):
Server version: 5.1.24-rc MySQL Community Server (GPL)
Type 'help;' or '\h' for help. Type '\c' to clear the buffer.
mysql>
GRANT ALL PRIVILEGES ON *.* TO 'apache'@'192.168.1.2' IDENTIFIED BY '12345678';
FLUSH PRIVILEGES;
FLUSH PRIVILEGES;
4、从Web管理界面登录NetScaler 8.0,进入Configuration页面(需要安装Java Runtime Environment,版本在JRE 1.4.x+以上):
5、点击【Load Balancing】──【Monitors】栏的“add”按钮,添加一个名为“mysql_slave”的MySQL健康检查:
①、Interval:正常情况下,10秒钟检查一次;
②、Response Timeout:每次检查的超时时间为8秒,必须小于Interval;
③、Down Time:宕机状态下,每5秒钟检查一次;
④、Retries:重试5次后仍然检查失败,标记服务器为宕机;
⑤、Type:选择MySQL;
⑥、Script Name:点击其后的“Browse...”按钮,选择我编写的MySQL Slave健康检查脚本“nsmysql-slave.pl”;
⑦、Dispatcher IP和Dispatcher Port必须填“127.0.0.1”和“3013”,不要改变;
⑧、User Name输入刚才创建的帐号“netscaler“,password输入创建帐号时设定的“12345678”。
6、点击【Load Balancing】──【Service Groups】栏的“add”按钮,添加一个名为“pool_mysql”的MySQL服务器池:
①、添加真实MySQL Slave服务器到“pool_mysql”服务器池,协议选择TCP:
②、健康检查方式选择第5步中创建的“mysql_slave”:
7、点击【Load Balancing】──【Virtual Servers】栏的“add”按钮,添加一个名为“vs_mysql_slave”的VIP(虚拟IP):
①、添加“pool_mysql”服务器池到名为“vs_mysql_slave”的VIP(192.168.1.5:3306),协议选择TCP:
②、负载均衡方式选择Least Connection(最小连接数):
8、Web服务器要访问MySQL Slave,只需访问NetScaler的VIP──192.168.1.5的3306端口即可。至此,已经完美解决多台MySQL Slave数据库的负载均衡问题。
MySQL主从库可以是不同的版本,但MySQL从库的版本不能小于MySQL主库的版本。
InnoDB存储引擎是行锁,不会存在大量锁表情况,对写操作有利,用于主库;MyISAM存储引擎虽然是表锁,但select查询速度在PHP+MySQL网站应用中要比InnoDB快5~20倍,用于MySQL Slave只读数据库。
“但是,NetScaler 8.0自带的MySQL健康检查脚本(nsmysql.pl)并不完善,它只能检查一条SQL语句执行是否出错,并不能检查MySQL主从结构中的MySQL Slave数据库同步是否正常、表有无损坏、同步延迟是否过大、是否出现错误、非sleeping状态的连程数是否过高等情况。”
你的意思是当多台mysql slave库提供读操作时,有可能因为同步异常问题导致前台读取的数据有误?
这个不太理解,这应该是基本的数据库原理。我不知道这种错误是否会真实存在,没有解决方案?
你的意思是当多台mysql slave库提供读操作时,有可能因为同步异常问题导致前台读取的数据有误?
这个不太理解,这应该是基本的数据库原理。我不知道这种错误是否会真实存在,没有解决方案?
数据库同步出错、MyISAM某张表坏、update同步锁表导致select查询被大量阻塞的问题,在实际应用中经常存在,为了保证前台读取的数据正常,不影响用户正常访问,利用nsmysql-slave.pl的健康检查解决了这个问题。
至于数据库发生故障,报警给监控人员,则由我目前正在编写的另一套专用监控系统来负责。目前已经实现邮件报警、MSN机器人报警。手机短信报警接口积极写完。
点击在新窗口中浏览此图片
http://zyan.cc/attachment/200806/monitor01.png
点击在新窗口中浏览此图片
http://zyan.cc/attachment/200806/monitor02.png
“从我的实际测试来看,NetScaler 8.0在七层负载均衡方面,性能和功能都要比F5 BIG-IP强。”
能否找时间聊聊?你到www.adntech.com上就能找到我。我请客吃饭一顿。。。
我在用过NetScaler 跟 BIGIP后,认为各有特色。
先看低端平台
从4层性能上来说,BIGIP是要强于Netscaler的(除了最低端的bigip只有cpu,没有np。)
7层的性能,bigip的某些型号实际处理能力只有1G,打开bigip低端型号的机箱,你能看到其前端交换板与后端7层处理板之间是一个GE的光纤,因此其理论最大值为1G。
4层性能netscaler完全没的比,与bigip差距太大。
7层性能对于netscaler来说,与其4层相差不大,因为都是同一个处理器,你打开netsclaer的机箱,观察其主板从Interface到处理器之间的电路,能明显看出来其4、7层处理芯片是同一个。因此netscaler的大多数型号7层处理能力也不会比bigip强。
当然不排除netscaler的某些新的信号改变了硬件架构。
在实际应用中,总是4层7层的处理都有的,因此从架构上来说,bigip要优于netsclaer。
对于高端平台
高端平台上,单port的4层处理上,各个厂家的处理并没有显著差距,毕竟都是boardcom的44G芯片一颗,要比较也是看谁舍得多用几颗芯片。同理对f5而言纯7层处理是需要cpu来做的,而大多数可以靠np完成,还有一些4层芯片即可处理。
这样做成一个层次化的处理芯片群组,比单纯的双核、多核或者多CPU的架构要先进,不同的芯片在处理不同的数据时,其效率是不一样的
因此,netsclaer 利用通用cpu来处理的话,在7层处理上更加灵活一些,但bigip并不比netsclaer差,唯一的区别就是一部分用np一部分用cpu处理,两相比较,就要根据应用来决定哪款产品更合适了。
总结就是,两个产品各有特色,但f5的bigip更胜一筹,因为毕竟大多数网络及应用都是4、7层都要处理的。
1,你的DB--MASTER和DB--BACKUP是如何保证高可用性的,也是用数据同步吗?
2,从库采用MYISAM引擎,我这里经常碰到数据表损坏的情况,而且修复起来比较麻烦,不知道楼主如何解决?
另外,据我所知,F5的很多功能都是由license控制的,比如cache之类的功能,不知道你们的设备是否购买了那台设备所有支持的功能