nginx+tomcat高可用、高性能jsp集群

nginx+tomcat高可用、高性能jsp集群
nginx+tomcat高可用、高性能jsp集群

#!/bin/bash

# BY kerryhu

# MAIL:king_819@https://www.360docs.net/doc/1f15185794.html,

# BLOG:https://www.360docs.net/doc/1f15185794.html,

# Please manual operation yum of before Operation.....

#yum -y install gcc gcc-c++ autoconf libjpeg libjpeg-devel libpng libpng-devel \

#freetype freetype-devel libxml2 libxml2-devel zlib zlib-devel glibc glibc-devel \

#glib2 glib2-devel bzip2 bzip2-devel ncurses ncurses-devel curl

curl-devel e2fsprogs \

#e2fsprogs-devel krb5 krb5-devel libidn libidn-devel openssl

openssl-devel openldap \

#openldap-devel nss_ldap openldap-clients openldap-servers

一、网络拓扑:

lvs-master: 192.168.9.201

LVS-backup: 192.168.9.202

LVS-VIP: 192.168.9.200

web_1: 192.168.9.203

web_2: 192.168.9.204

目的:搭建高可用、高性能的jsp集群

二、初始化系统

#init system

系统环境: CentOS 5.5(定制安装)

组件:

Base

Development Libraries

Development Tools

Editors

Text-based Internet

./init_system.sh #此脚本参见

https://www.360docs.net/doc/1f15185794.html,/172631/555535

三、LVS+keeplived

#关于LVS+keeplived的配置请参考我的另一篇博文《CentOS5.5环境下布署LVS+keepalived 》https://www.360docs.net/doc/1f15185794.html,/172631/401253

四、nginx、tomcat整合

#config web_1、web_2

#download software

cd /opt

wget

https://www.360docs.net/doc/1f15185794.html,/apache-mirror/tomcat/tomcat-6/v6.0.32/bin/apac he-tomcat-6.0.32.tar.gz

wget

https://www.360docs.net/doc/1f15185794.html,/otn-pub/java/jdk/6u25-b06/jdk-6u25-linux-i 586.bin

wget https://www.360docs.net/doc/1f15185794.html,/download/nginx-1.0.0.tar.gz

wget https://www.360docs.net/doc/1f15185794.html,/pcre/pcre-8.12.tar.gz

wget

https://www.360docs.net/doc/1f15185794.html,//tomcat/tomcat-connectors/native/1.1.20/sourc e/tomcat-native-1.1.20-src.tar.gz

wget https://www.360docs.net/doc/1f15185794.html,/dist/apr/apr-1.4.2.tar.gz

wget https://www.360docs.net/doc/1f15185794.html,/dist/apr/apr-util-1.3.9.tar.gz

#================================ 1、安装tomcat、JDK

=================================

mv apache-tomcat-6.0.32.tar.gz jdk-6u25-linux-i586.bin /usr/local/ tar -zxvf apache-tomcat-6.0.32.tar.gz

mv apache-tomcat-6.0.32 tomcat

chmod +x jdk-6u25-linux-i586.bin

./jdk-6u25-linux-i586.bin

#apr 与 tomcat-native 提供更好的伸缩性、性能和集成到本地服务器技术,如果没有apr技术,启动tomcat 时出现如下提示

#INFO: The APR based Apache Tomcat Native library which allows optimal performance in production environments was not found on the

java.library.path:

/usr/local/jdk1.6.0_25/jre/lib/i386/client:/usr/local/jdk1.6.0_25/jre /lib/i386:/usr/local/jdk1.6.0_25/jre/../lib/i386:/usr/java/packages/l ib/i386:/lib:/usr/lib

rpm -e --nodeps apr-1.2.7-11.el5_3.1

rpm -e --nodeps apr-1.2.7-11.el5_3.1

tar -zxvf apr-1.4.2.tar.gz

cd apr-1.4.2

./configure

make;make install

cd ../

tar -zxvf apr-util-1.3.9.tar.gz

cd apr-util-1.3.9

./configure --with-apr=/usr/local/apr

make;make install

cd ../

cp tomcat-native-1.1.20-src.tar.gz /usr/local/tomcat/bin/

cd /usr/local/tomcat/bin

tar -zxvf tomcat-native.tar.gz

cd ./tomcat-native-1.1.12-src/jni/native/

./configure --with-apr=/usr/local/apr

--with-java-home=/usr/local/jdk1.6.0_25

make;make install

#设置环境变量

cat >>/etc/profile<

export JAVA_HOME=/usr/local/jdk1.6.0_25

export CLASS_PATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib

export PATH=.:$PATH:$JAVA_HOME/bin

export CATALINA_HOME=/usr/local/tomcat

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/apr/lib

EOF

source /etc/profile

#查看java版本

java -version

#启动tomcat

/usr/local/tomcat/bin/startup.sh

echo "/usr/local/tomcat/bin/startup.sh" >> /etc/rc.local

#将tomcat添加到系统服务

cd /opt

wget

http://forja.cenatic.es/plugins/scmsvn/viewcvs.php/*checkout*/servers /tomcat/bin/jsvc.tar.gz?root=norma&rev=82&pathrev=82

mv jsvc.tar.gz /usr/local/tomcat/bin/

tar -zxvf jsvc.tar.gz

cd jsvc-src

chmod +x configure

./configure --with-java=/usr/local/jdk1.6.0_25

make

cp /usr/local/tomcat/bin/jsvc-src/native/Tomcat5.sh

/etc/rc.d/init.d/tomcat

chmod +x /etc/rc.d/init.d/tomcat

vi /etc/rc.d/init.d/tomcat

#chkconfig: 2345 85 15

#description: apache-tomcat.6 #这两行在#!/bin/sh下面添加

JAVA_HOME=/usr/local/jdk1.6.0_25

CATALINA_HOME=/usr/local/tomcat

DAEMON_HOME=/usr/local/tomcat/bin

TOMCAT_USER=tomcat

CATALINA_BASE=/usr/local/tomcat

CATALINA_OPTS="-Djava.library.path=/usr/local/apr/lib"

$DAEMON_HOME/jsvc-src/jsvc #有两处需要修改

#添加tomcat用户

groupadd tomcat

useradd -g tomcat -s /sbin/nologin -M tomcat

chown -R tomcat.tomcat /usr/local/tomcat

chkconfig --add tomcat

chkconfig --level 2345 tomcat on

#http://localhost:8080,如果看到猫的页面即tomcat和jdk安装成功

#新建文件目录/data/www为网站存放目录,设置server.xml文件,在Host name="localhost"处将appBase=的指向路径改为/data/www/test,创建index.jsp至/data/www /test/ROOT,内容为:“My web!”

#修改tomcat网站目录

#sed -i 's#appBase="webapps"#appBase="/data/www/test"#'

/usr/local/tomcat/conf/server.xml

#报错信息:

https://www.360docs.net/doc/1f15185794.html,ng.IllegalArgumentException: Document base /data/www/tru boshop/host-manager does not exist or is not a readable directory #解决方法:删除conf\Catalina\localhost目录下面的host-manager.xml、manager.xml两个文件

#============================= 2、安装Nginx

=============================

/usr/sbin/groupadd www

/usr/sbin/useradd -g www www -s /sbin/nologin

mkdir -p /data/www

chmod +w /data/www

chown -R www:www /data/www

tar zxvf pcre-8.12.tar.gz

cd pcre-8.12/

./configure

make;make install

cd ../

#使用Tcmalloc 优化nginx、mysql

wget

https://www.360docs.net/doc/1f15185794.html,/files/google-perftools-1.7.tar .gz

tar -zxvf google-perftools-1.7.tar.gz

cd google-perftools-1.7/

./configure

make;make install

echo "/usr/local/lib" > /etc/ld.so.conf.d/usr_local_lib.conf

/sbin/ldconfig

cd ../

tar zxvf nginx-1.0.0.tar.gz

cd nginx-1.0.0/

./configure --user=www --group=www --prefix=/usr/local/nginx

--with-http_stub_status_module --with-http_ssl_module

--with-http_flv_module --with-http_gzip_static_module

--with-google_perftools_module

make;make install

cd ../

mkdir -p /data/logs

chmod +w /data/logs

chown -R www:www /data/logs

#编辑配置文件

#编辑nginx.config

mv /usr/local/nginx/conf/nginx.conf

/usr/local/nginx/conf/nginx.conf.bak

cat >>/usr/local/nginx/conf/nginx.conf<

user www www;

worker_processes 8;

error_log /usr/local/nginx/logs/nginx_error.log crit;

pid /usr/local/nginx/nginx.pid;

#使用Tcmalloc优化nginx性能

google_perftools_profiles /var/tmp/tcmalloc;

#Specifies the value for maximum file descriptors that can be opened by this process.

worker_rlimit_nofile 65535;

#工作模式及连接数上限

events

{

use epoll;

worker_connections 65535;

}

#设定http服务器,利用它的反向代理功能提供负载均衡支持

http

{

#设定mime类型

include mime.types;

default_type application/octet-stream;

#charset gb2312;

#设定请求缓冲

server_names_hash_bucket_size 128;

client_header_buffer_size 32k;

large_client_header_buffers 4 32k;

client_max_body_size 300m;

sendfile on;

tcp_nopush on;

keepalive_timeout 60;

tcp_nodelay on;

server_tokens off;

client_body_buffer_size 512k;

proxy_connect_timeout 5;

proxy_send_timeout 60;

proxy_read_timeout 5;

proxy_buffer_size 16k;

proxy_buffers 4 64k;

proxy_busy_buffers_size 128k;

proxy_temp_file_write_size 128k;

# fastcgi_connect_timeout 300;

# fastcgi_send_timeout 300;

# fastcgi_read_timeout 300;

# fastcgi_buffer_size 64k;

# fastcgi_buffers 4 64k;

# fastcgi_busy_buffers_size 128k;

# fastcgi_temp_file_write_size 128k;

gzip on;

gzip_min_length 1k;

gzip_buffers 4 16k;

gzip_http_version 1.1;

gzip_comp_level 2;

gzip_types text/plain application/x-javascript text/css application/xml;

gzip_vary on;

#limit_zone crawler $binary_remote_addr 10m;

###禁止通过ip访问站点

server{

server_name _;

return 404;

}

server

{

listen 80;

server_name https://www.360docs.net/doc/1f15185794.html,;

index index.html index.htm index.jsp index.do;#设定访问的默认首页地址

root /data/www/shopxx;#设定网站的资源存放路径

#limit_conn crawler 20;

if (-d $request_filename)

{

rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;

}

#所有jsp的页面均交由tomcat处理

location ~ \.(jsp|jspx|do)?$ {

proxy_set_header Host $host;

proxy_set_header X-Real-IP $remote_addr;

proxy_pass http://127.0.0.1:8080;#转向tomcat处理

}

location

~ .*\.(htm|html|gif|jpg|jpeg|png|bmp|swf|ioc|rar|zip|txt|flv|mid|doc| ppt|pdf|xls|mp3|wma)$ #设定访问静态文件直接读取不经过tomcat

{

expires 30d;

}

location ~ .*\.(js|css)?$

{

expires 1h;

}

#定义访问日志的写入格式

log_format wwwlog '$remote_addr - $remote_user [$time_local] "$request" '

'$status $body_bytes_sent "$http_referer" '

'"$http_user_agent" $http_x_forwarded_for';

access_log /data/logs/www_nginx.log wwwlog;#设定访问日志的存放路径 }

server

{

listen 80;

server_name https://www.360docs.net/doc/1f15185794.html,;

index index.html index.htm index.jsp index.do;#设定访问的默认首页地址

root /data/www/jsprun;#设定网站的资源存放路径

#limit_conn crawler 20;

if (-d $request_filename)

{

rewrite ^/(.*)([^/])$ http://$host/$1$2/ permanent;

}

#所有jsp的页面均交由tomcat处理

location ~ \.(jsp|jspx|do)?$ {

proxy_set_header Host $host;

proxy_set_header X-Real-IP $remote_addr;

proxy_pass http://127.0.0.1:8080;#转向tomcat处理

}

location

~ .*\.(htm|html|gif|jpg|jpeg|png|bmp|swf|ioc|rar|zip|txt|flv|mid|doc| ppt|pdf|xls|mp3|wma)$ #设定访问静态文件直接读取不经过tomcat

{

expires 30d;

}

location ~ .*\.(js|css)?$

{

expires 1h;

}

#定义访问日志的写入格式

log_format bbslog '$remote_addr - $remote_user [$time_local] "$request" '

'$status $body_bytes_sent "$http_referer" '

'"$http_user_agent" $http_x_forwarded_for';

access_log /data/logs/bbs_nginx.log bbslog;#设定访问日志的存放路径 }

server

{

listen 80;

server_name https://www.360docs.net/doc/1f15185794.html,;

location / {

stub_status on;

access_log off;

}

}

}

EOF

#检测配置文件

#/usr/local/nginx/sbin/nginx -t

#启动nginx

/usr/local/nginx/sbin/nginx

echo "/usr/local/nginx/sbin/nginx" >> /etc/rc.local

#查看nginx主进程号

#ps -ef | grep "nginx: master process" | grep -v "grep" | awk -F ' ' '{print $2}'

#停止nginx

#/usr/local/nginx/sbin/nginx -s stop

#平滑重启

#/usr/local/nginx/sbin/nginx -s reload

#============================= 3、配置一套java商城系统,进行测试

=============================

cd /opt

wget https://www.360docs.net/doc/1f15185794.html,/rar/rarlinux-3.8.0.tar.gz

#rar解压

tar -zxvf rarlinux-3.8.0.tar.gz

cd rar

make install

cd /opt

unrar x jsprun.rar

mv jsprun /data/www/

#7z解压

wget

https://www.360docs.net/doc/1f15185794.html,/projects/p7zip/files/p7zip/9.13/p7zip_9.13_src _all.tar.bz2/download

tar -jxvf p7zip_9.13_src_all.tar.bz2

cd p7zip_9.13

make;make install

7za x shopxx.7z

mv shopxx /data/www/

#配置tomcat虚拟主机

vi /usr/local/tomcat/conf/server.xml

unpackWARs="true" autoDeploy="true">

unpackWARs="true" autoDeploy="true">

#使用cmake编译安装mysql

cd /opt

wget https://www.360docs.net/doc/1f15185794.html,/files/v2.8/cmake-2.8.4.tar.gz

wget https://www.360docs.net/doc/1f15185794.html,/mysql/MySQL-5.5/mysql-5.5.10.tar.gz

tar -zxvf cmake-2.8.4.tar.gz

cd cmake-2.8.4

./configu

make;make install

/usr/sbin/groupadd mysql

/usr/sbin/useradd -g mysql mysql -s /sbin/nologin

mkdir -p /data/mysql/data

mkdir -p /data/mysql/binlog

mkdir -p /data/mysql/relaylog

mkdir -p /data/mysql/mysql

chown -R mysql:mysql /data/mysql

cd /opt

tar zxvf mysql-5.5.10.tar.gz

cd mysql-5.5.10/

rm -rf CMakeCache.txt

cmake .

-DCMAKE_INSTALL_PREFIX=/usr/local/mysql/ -DMYSQL_DATADIR=/data/mysql /data

-DWITH_INNOBASE_STORAGE_ENGINE=1 -DMYSQL_TCP_PORT=3306 -DEXTRA_CHAR SETS=all -DDEFAULT_CHARSET=utf8 -DDEFAULT_COLLATION=utf8_general_ci -DMYSQL_UNIX_ADDR=/data/mysql/mysql.sock -DMYSQL_USER=mysql -DWITH_ DEBUG=0

make;make install

chmod +w /usr/local/mysql

chown -R mysql:mysql /usr/local/mysql

cat >>/data/mysql/https://www.360docs.net/doc/1f15185794.html,f<

[client]

character-set-server = utf8

port = 3306

socket = /data/mysql/mysql.sock

[mysqld]

character-set-server = utf8

replicate-ignore-db = mysql

replicate-ignore-db = test

replicate-ignore-db = information_schema

user = mysql

port = 3306

socket = /data/mysql/mysql.sock

basedir = /usr/local/mysql

datadir = /data/mysql/data

log-error = /data/mysql/mysql_error.log

pid-file = /data/mysql/mysql.pid

open_files_limit = 10240

back_log = 600

max_connections = 5000

max_connect_errors = 6000

table_cache = 614

external-locking = FALSE

max_allowed_packet = 32M

sort_buffer_size = 1M

join_buffer_size = 1M

thread_cache_size = 300

thread_concurrency = 8

query_cache_size = 512M

query_cache_limit = 2M

query_cache_min_res_unit = 2k

default-storage-engine = MyISAM

thread_stack = 192K

transaction_isolation = READ-COMMITTED

tmp_table_size = 246M

max_heap_table_size = 246M

long_query_time = 3

log-slave-updates

log-bin = /data/mysql/binlog/binlog

binlog_cache_size = 4M

binlog_format = MIXED

max_binlog_cache_size = 8M

max_binlog_size = 100M

relay-log-index = /data/mysql/relaylog/relaylog

relay-log-info-file = /data/mysql/relaylog/relaylog relay-log = /data/mysql/relaylog/relaylog

expire_logs_days = 30

key_buffer_size = 256M

read_buffer_size = 1M

read_rnd_buffer_size = 16M

bulk_insert_buffer_size = 64M

myisam_sort_buffer_size = 128M

myisam_max_sort_file_size = 10G

myisam_repair_threads = 1

myisam_recover

interactive_timeout = 120

wait_timeout = 120

skip-name-resolve

master-connect-retry = 10

slave-skip-errors = 1032,1062,126,1114,1146,1048,1396

#master-host = 192.168.1.2

#master-user = username

#master-password = password

#master-port = 3306

server-id = 1

innodb_additional_mem_pool_size = 16M

innodb_buffer_pool_size = 512M

innodb_data_file_path = ibdata1:256M:autoextend

innodb_file_io_threads = 4

innodb_thread_concurrency = 8

innodb_flush_log_at_trx_commit = 2

innodb_log_buffer_size = 16M

innodb_log_file_size = 128M

innodb_log_files_in_group = 3

innodb_max_dirty_pages_pct = 90

innodb_lock_wait_timeout = 120

innodb_file_per_table = 0

#log-slow-queries = /data/mysql/slow.log

#long_query_time = 10

[mysqldump]

quick

max_allowed_packet = 32M

EOF

#初始化mysql

/usr/local/mysql/scripts/mysql_install_db

-–defaults-file=/data/mysql/https://www.360docs.net/doc/1f15185794.html,f --basedir=/usr/local/mysql --datadir=/data/mysql/data --user=mysql

#利用TCMalloc提高mysql在高并发下的性能

vi /usr/local/mysql/bin/mysqld_safe

#在# executing mysqld_safe的下一行,加上:

export LD_PRELOAD=/usr/local/lib/libtcmalloc.so

#使用lsof命令查看tcmalloc是否起效

/usr/sbin/lsof -n | grep tcmalloc

#设置mysql启动文件

cp support-files/mysql.server /etc/rc.d/init.d/mysqld

vi /etc/rc.d/init.d/mysqld

basedir=/usr/local/mysql

datadir=/data/mysql/data

chmod 700 /etc/rc.d/init.d/mysqld

/etc/rc.d/init.d/mysqld start

/sbin/chkconfig --add mysqld

/sbin/chkconfig --level 2345 mysqld on

ln -s /usr/local/mysql/bin/mysql /sbin/mysql

ln -s /usr/local/mysql/bin/mysqladmin /sbin/mysqladmin

#设置root密码(753951)

/sbin/mysqladmin -u root password 753951

#配置库文件搜索路径

echo "/usr/local/mysql/lib/mysql" >> /etc/ld.so.conf

/sbin/ldconfig

#添加/usr/local/mysql/bin到环境变量PATH中

export PATH=$PATH:/usr/local/mysql/bin

#添加mysql管理帐户

#mysql -h localhost -u root -p753951

#msqyl> use mysql;

#msqyl> grant all on *.* to 'kerry'@'192.168.9.100' identified by

'852741';

#msqyl> flush privileges;

#msqyl> exit;

#创建一个shopxx空库

CREATE DATABASE shopxx DEFAULT CHARACTER SET utf8 DEFAULT COLLATE

utf8_general_ci;

#=============================== 4、tomcat优

化 ============================

#添加tomcat管理员

#Tomcat 6.x不再提供admin管理工具(Tomcat's administration web application is no longer installed by default,Download and install the "admin" package to use it),要自己安装

cd /opt

wget

https://www.360docs.net/doc/1f15185794.html,/dist/tomcat/tomcat-5/v5.5.26/bin/apache-tom cat-5.5.26-admin.tar.gz

wget

https://www.360docs.net/doc/1f15185794.html,/apache//commons/logging/binaries/commons-lo gging-1.1.1-bin.tar.gz

wget

https://www.360docs.net/doc/1f15185794.html,/apache-mirror//commons/modeler/binaries/common s-modeler-2.0.1.tar.gz

tar -zxvf apache-tomcat-5.5.26-admin.tar.gz

cd apache-tomcat-5.5.26

cp -r conf/Catalina /usr/local/tomcat/conf/

cp -r server /usr/local/tomcat/

cd /opt

tar -zxvf commons-modeler-2.0.1.tar.gz

cd commons-modeler-2.0.1

cp -r *.jar /usr/local/tomcat/lib/

cd ../

tar -zxvf commons-logging-1.1.1-bin.tar.gz

cd commons-logging-1.1.1

cp -r *.jar /usr/local/tomcat/lib/

vi /usr/local/tomcat/conf/tomcat-users.xml

#在 中间添加 ,并去掉注释

vi /usr/local/tomcat/conf/context.xml

docBase="/usr/local/tomcat/webapps/manager" />

#修改Java虚拟机的虚拟内存,tomcat默认的JVM比较小,查看JVM,打开http://127.0.0.1:8080/,点击"status",查看JVM选项

#在修改配置文件的时候不知道怎么把manager/WEB-INF/web.xml搞没见了,导致在访问管理页面的时候出现“The requested resource (/manager/s tatus) is not available.”

Free memory: 3.25 MB Total memory: 7.62 MB Max memory: 121.81 MB

vi /etc/init.d/tomcat

#在CATALINA_OPTS="-Djava.library.path=/usr/local/apr/lib"下方添加一

JAVA_OPTS="-Xms1024m -Xmx1024m -Xmn256m -Djava.awt.headless=true"

#重启一下tomcat,然后再次查看JVM

#Free memory: 953.12 MB Total memory: 998.43 MB Max memory: 998.43 MB #修改tomcat并发连接数,tomcat6.0 默认并发数为200,查看方法和JVM一样,

查看http-8080选项

Max threads: 200

vi /usr/local/tomcat/conf/server.xml

#修改前:

redirectPort="8443"

connectionTimeout="20000"

/>

#修改后:

maxHttpHeaderSize="8192"

useBodyEncodingForURI="true"

maxThreads="1000"

redirectPort="8443"

enableLookups="false"

compression="on"

compressionMinSize="2048"

compressableMimeType="text/html,text/xml,text/javascr ipt,text/css,text/plain"

connectionTimeout="20000"

disableUploadTimeout="true"

/>

port:Tomcat服务器监听的端口号

maxHttpHeaderSize:Http的Header的最大限制

enableLookups="false" 使用允许DNS查询,通常情况下设置为false redirectPort 服务器正在处理http请求时收到了一个SSL传输请求后重定向的端口号

maxThreads Tomcat使用线程来处理接收的每个请求。这个值表示Tomcat可创建的最大的线程数。

acceptCount 指定当所有可以使用的处理请求的线程数都被使用时,可以放到处理队列中的请求数,超过这个数的请求将不予处理。

connectionTimeout 网络连接超时,单位:毫秒。设置为0表示永不超时,这样设置有隐患的。通常可设置为30000毫秒。

minSpareThreads Tomcat初始化时创建的线程数。

maxSpareThreads 一旦创建的线程超过这个值,Tomcat就会关闭不再需要的socket线程。

compression="on" 打开压缩功能

compressionMinSize 启用压缩的输出内容大小,这里面默认为2KB compressableMimeType压缩类型

#重启tomcat后再次查看

Max threads: 1000

高性能计算集群(HPC CLUSTER)

高性能计算集群(HPC CLUSTER) 1.1什么是高性能计算集群? 简单的说,高性能计算(High-Performance Computing)是计算机科学的一个分支,它致力于开发超级计算机,研究并行算法和开发相关软件。 高性能集群主要用于处理复杂的计算问题,应用在需要大规模科学计算的环境中,如天气预报、石油勘探与油藏模拟、分子模拟、基因测序等。高性能集群上运行的应用程序一般使用并行算法,把一个大的普通问题根据一定的规则分为许多小的子问题,在集群内的不同节点上进行计算,而这些小问题的处理结果,经过处理可合并为原问题的最终结果。由于这些小问题的计算一般是可以并行完成的,从而可以缩短问题的处理时间。 高性能集群在计算过程中,各节点是协同工作的,它们分别处理大问题的一部分,并在处理中根据需要进行数据交换,各节点的处理结果都是最终结果的一部分。高性能集群的处理能力与集群的规模成正比,是集群内各节点处理能力之和,但这种集群一般没有高可用性。 1.2 高性能计算分类 高性能计算的分类方法很多。这里从并行任务间的关系角度来对高性能计算分类。 1.2.1 高吞吐计算(High-throughput Computing) 有一类高性能计算,可以把它分成若干可以并行的子任务,而且各个子任务彼此间没有什么关联。因为这种类型应用的一个共同特征是在海量数据上搜索某些特定模式,所以把这类计算称为高吞吐计算。所谓的Internet计算都属于这一类。按照Flynn的分类,高吞吐计算属于SIMD(Single Instruction/Multiple Data,单指令流-多数据流)的范畴。 1.2.2 分布计算(Distributed Computing) 另一类计算刚好和高吞吐计算相反,它们虽然可以给分成若干并行的子任务,但是子任务间联系很紧密,需要大量的数据交换。按照Flynn的分类,分布式的高性能计算属于MIMD (Multiple Instruction/Multiple Data,多指令流-多数据流)的范畴。 1.3高性能计算集群系统的特点 可以采用现成的通用硬件设备或特殊应用的硬件设备,研制周期短; 可实现单一系统映像,即操作控制、IP登录点、文件结构、存储空间、I/O空间、作业管理系统等等的单一化; 高性能(因为CPU处理能力与磁盘均衡分布,用高速网络连接后具有并行吞吐能力); 高可用性,本身互为冗余节点,能够为用户提供不间断的服务,由于系统中包括了多个结点,当一个结点出现故障的时候,整个系统仍然能够继续为用户提供服务; 高可扩展性,在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器,从而能够最大限度地扩展系统以满足不断增长的应用的需要; 安全性,天然的防火墙; 资源可充分利用,集群系统的每个结点都是相对独立的机器,当这些机器不提供服务或者不需要使用的时候,仍然能够被充分利用。而大型主机上更新下来的配件就难以被重新利用了。 具有极高的性能价格比,和传统的大型主机相比,具有很大的价格优势; 1.4 Linux高性能集群系统 当论及Linux高性能集群时,许多人的第一反映就是Beowulf。起初,Beowulf只是一个著名的科学计算集群系统。以后的很多集群都采用Beowulf类似的架构,所以,实际上,现在Beowulf已经成为一类广为接受的高性能集群的类型。尽管名称各异,很多集群系统都是Beowulf集群的衍生物。当然也存在有别于Beowulf的集群系统,COW和Mosix就是另两类著名的集群系统。 1.4.1 Beowulf集群 简单的说,Beowulf是一种能够将多台计算机用于并行计算的体系结构。通常Beowulf系统由通过以太网或其他网络连接的多个计算节点和管理节点构成。管理节点控制整个集群系统,同时为计算节点提供文件服务和对外的网络连接。它使用的是常见的硬件设备,象普通PC、以太网卡和集线器。它很少使用特别定制的硬件和特殊的设备。Beowulf集群的软件也是随处可见的,象Linux、PVM和MPI。 1.4.2 COW集群 象Beowulf一样,COW(Cluster Of Workstation)也是由最常见的硬件设备和软件系统搭建而成。通常也是由一个控制节点和多个计算节点构成。

服务器集群实验

2003服务器集群实验 一、服务器集群简介 什么是服务器群集?有何作用? 服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cl uster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。 服务器群集不同于NLB群集,服务器群集是有独立计算机系统(节点)构成的组,不同节点协同工作,就像单个系统一样,从而确保关键的应用程序和资源始终可由客户端使用。用于访问量较少的企业内网的服务器的冗余和可靠性。 哪些版本的操作系统支持服务器群集? 只有两个版本的windows server 2003系统支持该技术:企业版和数据中心版。 服务器群集的应用范围? 服务器群集最多可以支持8个节点,可实现DHCP、文件共享、后台打印、MS SQL server、exchange server等服务的可靠性。 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点

LVS keepalived负载均衡高可用 配置安装大全

LVS+Keepalived实现高可用集群 一、基础介绍 (2) 二、搭建配置LVS-NA T模式 (2) 三、搭建配置LVS-DR模式 (4) 四、另外一种脚本方式实现上面LVS-DR模式 (6) 五、keepalived + LVS(DR模式) 高可用 (8) 六、Keepalived 配置文件详细介绍 (11)

一、基础介绍 (一)根据业务目标分成三类: High Availability 高可用 Load Balancing 负载均衡 High Performance 高性能 (二)实现集群产品: HA类: rhcs、heartbeat、keepalived LB类: haproxy、lvs、nginx、f5、piranha HPC类: https://www.360docs.net/doc/1f15185794.html,/index/downfile/infor_id/42 (三)LVS 负载均衡有三种模式: LVS-DR模式(direct router)直接路由模式 进必须经过分发器,出就直接出 LVS-NAT模式(network address translation) 进出必须都经过分发器 LVS-TUN模式(ip tunneling)IP隧道模式 服务器可以放到全国各地 二、搭建配置LVS-NAT模式 1 、服务器IP规划: DR服务器添加一张网卡eth1,一个网卡做DIP,一个网口做VIP。 设置DIP、VIP IP地址: DIP的eth1和所有RIP相连同一个网段 CIP和DIP的eth0(Vip)相连同一个网段 Vip eth0 192.168.50.200 Dip eth1 192.168.58.4 客户机IP: Cip 192.168.50.3

最新高性能计算平台设计方案模板

XXXX 高性能计算平台建设方案 XXXXX 2013年4月

目录 1 概述 (2) 1.1 背景概况 (2) 1.2 建设内容 (3) 1.3 设计原则 (3) 2 总体架构 (5) 3 高性能计算平台硬件系统 (6) 3.1 平台架构图 (6) 3.2 主要设备选型 (8) 3.3 Cluster集群系统 (9) 3.4 计算节点 (10) 3.5 管理节点 (10) 3.6 I/O存储节点 (11) 3.7 网络系统方案............................................................................... 错误!未定义书签。 3.8 管理网络 (12) 3.9 监控网络 (12) 3.10 存储系统 (12) 4 高性能计算平台软件系统 (13) 4.1 64位Linux操作系统 (13) 4.2 集群管理软件 (14) 4.3 作业调度系统 (14) 4.4 并行文件系统 (15) 4.5 集群并行计算环境 (15) 4.6 标准库函数 (16) 4.7 标准应用软件 (16) 5 项目经费预算 (17) 5.1 经费来源 (17) 5.2 经费支出预算 (17) 附页——高性能计算平台技术参数要求 (18)

1概述 1.1背景概况 20世纪后半期,全世界范围掀起第三次产业革命的浪潮,人类开始迈入后 工业社会——信息社会。在信息经济时代,其先进生产力及科技发展的标志就是 计算技术。在这种先进生产力中高性能计算机(超级计算机)更是具有代表性。 时至今日,计算科学(尤其是高性能计算)已经与理论研究、实验科学相并列,成为现代科学的三大支柱之一。 三种科研手段中,理论研究为人类认识自然界、发展科技提供指导,但科学 理论一般并不直接转化为实用的技术;实验科学一方面是验证理论、发展理论的重要工具,另一方面,它是在理论的指导下发展实用技术,直接为经济发展服务;计算科学的发展也有相当悠久的历史,只是在计算机这一强大的计算工具问世之前,计算只能利用人类的大脑和简单的工具,计算应用于科学研究有天然的局限性,限制了它作用的发挥;随着计算机技术的发展,使用科学计算这一先进的技术手段不断普及,逐渐走向成熟。科学计算可以在很大程度上代替实验科学,并能在很多情况下,完成实验科学所无法完成的研究工作。科学计算也直接服务于实用科技,并为理论的发展提供依据和机会。在许多情况下,或者理论模型过于复杂甚至尚未建立,或者实验费用过于昂贵甚至不允许进行,此时计算模拟就成为求解问题的唯一或主要手段了。 目前,高性能计算已广泛应用于国民经济各领域,发挥着不可替代的重要作用: a) 基础学科中深入的知识发现,问题规模的扩大和求解精度的增加需要更 高性能的计算资源。例如,计算立体力学、计算材料学、计算电磁学。 b) 多学科综合设计领域中大量多部门协同计算需要构建高性能的综合平 台。例如,汽车设计、船舶设计。 c) 基于仿真的工程科学结合传统工程领域的知识技术与高性能计算,提供 经济高效地设计与实践方法。例如,基于仿真的医学实践、数字城市模拟、核电、油田仿真工具、新材料开发、碰撞仿真技术、数字风洞。

浪潮WIN2K 集群服务解决方案

浪潮WIN2K 集群服务解决方案 集群服务的需求分析 随着Internet服务和电子商务的迅速发展,计算机系统的重要性也日益上升,对服务器可伸缩性和高可用性的要求也变得越来越高。集群技术的出现和发展则很好地解决了这两个问题。群集是由一组独立的计算机组成,这些计算机一起工作以运行一系列共同的应用程序,同时,为用户和应用程序提供单一的系统映射。群集内的计算机物理上通过电缆连接,程序上则通过群集软件连接。这些连接允许计算机使用故障应急与负载平衡功能,而故障应急与负载平衡功能在单机上是不可能实现的。 有网络负载平衡功能的Windows 2000为在分布和负载平衡的方式下建立关键且合乎要求的网站的工作提供了完整的基础结构。与组件服务的分布式应用程序特性和Internet 信息服务的增强可伸缩性相结合,网络负载平衡有助于确保服务能够灵活处理最重的通信负荷,同时,保持对服务器状态的监控,确保系统不停机。 Win2000群集技术具有以下特点: ·可伸缩性:加入更多的处理器或计算机可提高群集的计算能力,一般的桌面机每秒能够处理几千个请求,而传统的IA服务器每秒能够处理几万个请求。那么对于需要每秒处理几十万个请求的企业来说,如果不采用集群技术,唯一的选择就是购买更加高档的中、小型计算机。如果这样做,虽然系统性能提高了十倍,但其购买价格和维护费用就会上升几十倍甚至更多。 ·高度的可用性:群集具有避免单点故障发生的能力。应用程序能够跨计算机进行分配,以实现并行运算与故障恢复,并提供更高的可用性。即便某一台服务器停止运行,一个由进程调用的故障应急程序会自动将该服务器的工作负荷转移至另一台服务器,以保证提供持续不断的服务。 ·易管理性:群集以单一系统映射的形式来面向最终用户、应用程序及网络,同时,也为管理员提供单一的控制点,而这种单一控制点则可能是远程的。 随着计算机应用地位的逐渐提升,系统安全和重要性的日益增加,基于Win2000的负载均衡必将会有着极为广阔的应用前景。 Win2K集群技术 一、集群

高可用性集群系统的实现

高可用性集群系统的实现 《Linux企业应用案例精解》第8章主要介绍一下虚拟化技术应用。本节为大家介绍高可用性集群系统的实现。 8.3.5 高可用性集群系统的实现(1) VMware Infrastructure 的体系结构和典型配置 资源动态分配和高可用性的实现为构建高可用性集群系统提供了有力的保障,采用VMwae构建铁路企业高可用性集群,不需要为系统中的每台服务器分别添置备用服务器,就可以有效地降低系统成本,在基于VMware的我企业高可用性集群中,备用服务器安装了VMware ESX Server,与数据库服务器、Web服务器、OA服务器和文件服务器等构成高可用性集群,同时采用数据库备份服务器实现差额计划备份。 使用VMware提供的虚拟基础架构解决方案,服务器不再需要随着业务增加而添加,整个IT基础架构能得到有效控制并可充分发挥效能。只有当整体资源出现不足的时候,才需要增加服务器。而且对系统资源的

添加也非常简单,不再需要做繁琐的硬件维护以及业务迁移,只需要简单地将新服务器安装VMWARE? INFRASTRUCTURE 3软件,并添加到已有的VMWARE? INFRASTRUCTURE 3架构中即可,新增资源将自动分配到各个最需要的业务环境中。 在HA和DRS功能的共同支撑下,虚拟机的稳定、不间断运行得到了保证,而且,在没有搭建Cluster环境的情况下,迁移、升级依旧能不中断服务。哪怕是硬件升级、添加,正常停机维护等情况,也能够保证所有的业务正常运行,客户端访问服务器不产生业务中断现象。新的服务器虚拟化架构中另一个重点是VMware HA 的部署,它是整个服务器系统安全、可靠运行的一道防线。传统的热备机方式最大的问题就是容易造成资源的大量闲置;在正常运行状态下,所有备机服务器都处于闲置状态,不仅造成计算资源的空耗,而且还浪费大量的电力和散热资源,投资回报率非常低。 如何应对Linux系统软件包的依赖性问题 不管是初步跨入Linux殿堂的新手还是,具有多年经验的专家,在安装或编译软件包的过程中或多或少的都会遇到包的依赖问题从而导致安装过程无法继续,比如管理员在安装php软件包需要libgd.so文件,而这个文件属于gb软件包。但是在安装gb软件包时,可能这个软件包跟其他软件包又具有依赖关系,又需要安装其他软件包才行。这时有的管理员便失去耐心。在遇到这种Linux软件包依赖关系问题,该如何解决呢?在谈这个具体的措施之前,先跟大家聊聊Linux系统里的软件爱你依赖性问题。 我们把处理rpm依赖性故障的策略可以分成两类解决依赖性故障的自动方法和手工方法。但当安装不属于发行一部分的软件包时自动方法是不可用的。在描述如何手工解决依赖性故障后,将简要描述如何使用自动方法之一(YUM),但首先需要了解它们是什么及rpm如何强制实施它们。 一、什么是依赖性 程序依赖于程序代码的共享库,以便它们可以发出系统调用将输出发送到设备或打开文件等(共享库存在于许多方面,而不只局限于系统调用)。没有共享库,每次程序员开发一个新的程序,每个程序员都需要从头开始重写这些基本的系统操作。当编译程序时,程序员将他的代码链接到这些库。如果链接是静态的,编译后的共享库对象代码就添加到程序执行文件中;如果是动态的,编译后的共享库对象代码只在运行时需要它时由程序员加载。动态可执行文件依赖于正确的共享库或共享对象来进行操作。RPM依赖性尝试在安装时强制实施动态可执行文件的共享对象需求,以便在以后--当程序运行时--不会有与动态链接过程有关的任何问题。

高性能计算集群项目采购需求

高性能计算集群项目采购需求 以下所有指标均为本项目所需设备的最小要求指标,供应商提供的产品应至少大于或等于所提出的指标。系统整体为“交钥匙”工程,厂商需确保应标方案的完备性。 投标商在投标方案中须明确项目总价和设备分项报价。数量大于“1”的同类设备,如刀片计算节点,须明确每节点单价。 硬件集成度本项目是我校校级高算平台的组成部分,供应商提供的硬件及配件要求必须与现有相关硬件设备配套。相关系统集成工作由供应商负责完成。 刀片机箱供应商根据系统结构和刀片节点数量配置,要求电源模块满配,并提供足够的冗余。配置管理模块,支持基于网络的远程管理。配置交换模块,对外提供4个千兆以太网接口,2个外部万兆上行端口,配置相应数量的56Gb InfiniBand接口 刀片计算节点双路通用刀片计算节点60个,单节点配置2个CPU,Intel Xeon E5-2690v4(2.6GHz/14c);不少于8个内存插槽,内存64GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD 硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand 接口;满配冗余电源及风扇。 刀片计算节点(大内存)双路通用刀片计算节点5个,单节点配置2个CPU,Intel Xeon E5-2690v4;不少于8个内存插槽,内存128GB,主频≥2400;硬盘裸容量不小于200GB,提供企业级SAS或SSD硬盘;每节点配置≥2个千兆以太网接口,1个56Gb InfiniBand接口;满配冗余电源及风扇。 GPU节点2个双路机架GPU节点;每个节点2个Intel Xeon E5-2667 v4每节点2块NVIDIA Tesla K80GPU加速卡;采用DDR4 2400MHz ECC内存,每节点内存16GB*8=128GB;每节点SSD 或SAS硬盘≥300GB;每节点配置≥2个千兆以太网接口,1个56Gb/s InfiniBand接口;满配冗余电源及风扇。 数据存储节点机架式服务器2台,单台配置2颗Intel Xeon E5-2600v4系列CPU;配置32GB内存,最大支持192GB;配置300GB 2.5" 10Krpm

服务器集群系统解决方案

惠普服务器集群系统解决方案 计算系统与信息网络不停顿的运行与连接即高可用性已成为各行业特别是要求实时行业业务运行的基本要求。 惠普凭借丰富的经验创制的HP NetServer为您提供当今市场上最完备的高可用性系列产品和最优质的服务,使您的关键业务应用程序能连续可靠地高效运转。惠普还与业界领先的软硬件供应商联袂,为优化您的业务环境提供最为广泛的选择。同时,我们还可为您提供得益于最新、最优技术的服务器解决方案。 对于可用性要求高的公司,HP NetServer支持集群技术,例如Microsoft Windows NT(r)Server 4.0Enterprise Edition和Windows2000Advanced Server中包含的Microsoft(r)Cluster Server(MSCS),HP NetServer还支持Novell’s NetWare Cluster Services for NetWare5和Veritas公司的高可用性解决方案。同时在应用前景广泛的Linux操作系统平台上惠普公司也有性能优异的Longer HA双机解决方案。 某些业务要求为最终用户或其它系统提供的服务不能有丝毫中断,为此惠普采用Microsoft Windows NT环境下的虚拟服务器阵列技术,为您提供"HP NetServer超级保障解决方案",作为集群技术的补充,这些业界领先的解决方案将系统的正常运行时间提升到最高水平--使关键任务服务实现了不停顿的处理,连续的数据存取,不间断的连接以及始终如一的性能。 用户可根据实际的应用需求选择合适的解决方案,使HP NetServer真正的无忧之选。 在今天的商务应用系统中,稳定持续的系统运行时间变得越来越重要,而传统意义中的小型机系统使得普通用户望而却步。用户需用的是更高的可用性以及更低的成本。 集群系统 集群系统是一种提供高可用性、改善性能和增强企业应用软件可管理性的有效途径。随着基于Intel平台的服务器业已成为关键性业务和应用的主流服务器,集群技术的应用也日益广泛。 集群系统优点 集群可有效地提高系统的可用性。如果一个服务器或应用程序崩溃,集群系统中另一个服务器在继续工作的同时,接管崩溃服务器的任务,最大限度地缩短用户服务器和应用程序宕机的时间。 集群的另外一个优点是通过增加现有系统的的节点,提高了系统的延展性,使系统因故障中断的可能性降到最低。在这种架构中,多服务器的运行是针对相同的应用程序或数据库

利用LVS+Keepalived 实现高性能高可用负载均衡服务器

LVS+Keepalived 介绍 LVS LVS是Linux Virtual Server的简写,意即Linux虚拟服务器,是一个虚拟的服务器集群系统。本项目在1998年5月由章文嵩博士成立,是中国国内最早出现的自由软件项目之一。目前有三种IP负载均衡技术(VS/NAT、VS/TUN和VS/DR); 十种调度算法(rrr|wrr|lc|wlc|lblc|lblcr|dh|sh|sed|nq)。 Keepalvied Keepalived在这里主要用作RealServer的健康状态检查以及LoadBalance主机和BackUP 主机之间failover的实现 二. 网站负载均衡拓朴图 IP信息列表: 名称 IP LVS-DR-Master 61.164.122.6 ? LVS-DR-BACKUP 61.164.122.7 ? LVS-DR-VIP 61.164.122.8 ? WEB1-Realserver 61.164.122.9 ? WEB2-Realserver 61.164.122.10 ? GateWay 61.164.122.1 复制代码 三. 安装LVS和Keepalvied软件包 1. 下载相关软件包 #mkdir /usr/local/src/lvs ? #cd /usr/local/src/lvs ? #wget https://www.360docs.net/doc/1f15185794.html,/software/kernel-2.6/ipvsadm-1.24.tar.gz ? #wget https://www.360docs.net/doc/1f15185794.html,/software/keepalived-1.1.15.tar.gz 复制代码 2. 安装LVS和Keepalived #lsmod |grep ip_vs ? #uname -r ? 2.6.18-53.el5PAE ? #ln -s /usr/src/kernels/2.6.18-53.el5PAE-i686/ /usr/src/linux ? ? #tar zxvf ipvsadm-1.24.tar.gz ? #cd ipvsadm-1.24 ? #make && make install ? #find / -name ipvsadm # 查看ipvsadm的位置 ? ? #tar zxvf keepalived-1.1.15.tar.gz ? #cd keepalived-1.1.15 ? #./configure && make && make install

高可用性集群解决方案设计HA

1.业务连续 1.1.共享存储集群 业务系统运营时,服务器、网络、应用等故障将导致业务系统无常对外提供业务,造成业务中断,将会给企业带来无法估量的损失。针对业务系统面临的运营风险,Rose提供了基于共享存储的高可用解决方案,当服务器、网络、应用发生故障时,Rose可以自动快速将业务系统切换到集群备机运行,保证整个业务系统的对外正常服务,为业务系统提供7x24连续运营的强大保障。 1.1.1.适用场景 基于共享磁盘阵列的高可用集群,以保障业务系统连续运营 硬件结构:2台主机、1台磁盘阵列

主机 备机心跳 磁盘阵列 局域网 1.1. 2.案例分析 某证券公司案例 客户需求分析 某证券公司在全国100多个城市和地区共设有40多个分公司、100多个营业部。经营围涵盖:证券经纪,证券投资咨询,与证券交易、证券投资活动有关的财务顾问,证券承销与保荐,证券自营,证券资产管理,融资融券,证券投资基金代销,金融产品代销,为期货公司提供中间介绍业务,证券投资基金托管,股票期权做市。 该证券公司的系统承担着企业的部沟通、关键信息的传达等重要角色,随着企业的业务发展,系统的压力越来越重。由于服务器为单机运行,如果发生意外宕机,将会给企业的日常工作带来不便,甚至

给企业带来重大损失。因此,急需对服务器实现高可用保护,保障服务器的7×24小时连续运营。 解决方案 经过实际的需求调研,结合客户实际应用环境,推荐采用共享存储的热备集群方案。部署热备集群前的单机环境:业务系统,后台数据库为MySQL,操作系统为RedHat6,数据存储于磁盘阵列。 在单机单柜的基础上,增加1台备用主机,即可构建基于共享存储的热备集群。增加1台物理服务器作为服务器的备机,并在备机部署系统,通过Rose共享存储热备集群产品,实现对应用的高可用保护。如主机上运行的系统出现异常故障导致宕机,比如应用服务异常、硬件设备故障,Rose将实时监测该故障,并自动将系统切换至备用主机,以保障系统的连续运营。

双机热备、集群及高可用性入门

双机热备、集群及高可用性入门

什么是双机热备? 双机热备这一概念包括了广义与狭义两种意义。 从广义上讲,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。(相关文章:为什么需要双机热备?) 双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。但在实际应用中,可能会出现多台服务器的情况,即服务器集群。(相关文章:双机软件与集群软件的异同) 双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。(相关文章:双机热备的实现模式) 实现双机热备,需要通过专业的集群软件或双机软件。(相关文章:双机与集群软件的选择) 从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。(相关文章:双机热备、双机互备与双机双工的区别) 为什么要做双机热备? 双机热备针对的是服务器的故障。 服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。而如果技术人员不在现场,则恢复服务的时间就更长了。 而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务不能恢复会造成多大的影响。 在考虑双机热备时,需要注意,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。

高性能计算集群(PC Cluster)用户指南

高性能计算集群(PC Cluster)用户指南 大气科学系应越 第二版2008-12 目录 -认识cluster -使用cluster -linux常用命令 -软件 -文件传输 第一章:认识cluster 1.什么是cluster系统 cluster一般由一台主机(master)和多台节点机(node)构成,是一种松散耦合的计算节点集合。为用户提供网络服务或应用程序的单一客户视图,同时提供接近容错机的故障恢复能力。通常cluster的每台机器通过相应的硬件及软件互连,每个群集节点都是运行其自己进程的独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据。cluster概念的提出在70年代主要是为了进行一些大运算量的科学计算。随着网络的发展,之后的cluster系统还被用作网络服务器,发挥其故障恢复和均衡负载的能力。 使用PC机构建cluster的好处在于开发成本低,而且由于每台节点机都是普通的PC机,在某一台机器发生故障的时候,可以方便的进行维护,而不影响整个系统的运行。 大气科学系的cluster系统,由16台64位的PC机组成。其中一台主机(master),15台节点机(node01~node15)。这16台机器每台有两个4核的CPU,也就是说每个节点上可以同时提供8个CPU。操作系统使用的是CentOS的Linux发行版。图1为大气科学系cluster目前的结构。其中console 和c0101~c0107是大气系早期的cluster系统,节点安装的是RedHat的Linux发行版,precluster曾经作为门户机,目前已经更新为CentOS的操作系统。 登录master的IP地址为162.105.245.3,这个地址由于物理大楼的IP变动比较频繁,所以可能会时不时改变,而precluster的IP地址162.105.245.238则比较稳定。这两个地址目前都可以从校外访问。 cluster的应用主要集中在并行计算上。虽然单个节点的单CPU运算效率比普通的笔记本或是台式机都高很多,但是cluster当初被设计出来就是为了进行多CPU协同运算的,而不是仅仅为了提高单CPU的运算效率。所以我们鼓励用户在cluster上进行并行计算,而把一些单CPU也能解决的工作

两台服务器的集群方案

本文由szg81贡献 doc1。 七台服务器的集群方案 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于 管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业 的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大 的开销。面向 Internet 的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然 趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是 CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管 理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。和传统的高性能计算 机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具 有较高的响应能力,能够满足当今日益增长的信息服务的需求。 集群技术应用的需求 Internet 用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而 CPU 的发展无法跟上不断增长的需求, 于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。 ●应用规模的发展使单个服务器难以承担负载。 ●不断增长的需求需要硬件有灵活的可扩展性。 ●关键性的业务需要可靠的容错机制。 IA 集群系统(CLUSTER)的特点 ●由若干完整的计算机互联组成一个统一的计算机系统; ●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备; ●需要特殊软件支持,例如支持集群技术的操作系统或数据库等等; ●可实现单一系统映像,即操作控制、IP 登录点、文件结构、存储空间、I/O 空间、作业管理系统等等的单一化; ●在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器, 从而能够最大限度地扩展系统以满足不断增长的应用的需 要; ●可用性是集群系统应用中最重要的因素,是评价和衡量系统的一个重要指标; ●能够为用户提供不间断的服务,由于系统中包括了多个结点,当一个结点出现故障的时候,整个系统仍然能够继续为用户提供 服务; ●具有极高的性能价格比,和传统的大型主机相比,具有很大的价格优势; ●资源可充分利用,集群系统的每个结点都是相对独立的机器,当这些机器不提供服务或者不需要使用的时候,仍然能够被充分 利用。而大型主机上更新下来的配件就难以被重新利用了。 实现服务器集群的硬件配置 ●网络服务器 七台 ●服务器操作系统硬盘 七块 ●ULTRA 160 LVD SCSI 磁盘阵列 一个 ●18G SCSI 硬盘 十块 ●网络服务网卡 十四块 服务器集群的实践步骤 ●在安装机群服务之前的准备: 1、 十四块 18G SCSI 硬盘组成磁盘阵列,做 RAID5。 2、 两台服务器要求都配置双网卡,分别安装 Microsoft Windows Server2008 操作系统,并配置网络。 3、 所有磁盘必须设置成基本盘,阵列磁盘分区必须大于 7 个。 4、 每台服务器都要加入域当中,成为域成员,并且在每台服务器上都要有管理员权限。 ●安装配置服务器网络要点 1、在这一部分,每个服务器需要两个网络适配器,一个连接公众网,一个连接内部网(它只包含了群集节点) 内部网适配器 。 建立点对点的通信、群集状态信号和群集管理。每个节点的公众网适配器连接该群集到公众网上,并在此驻留客户。 2、安装 Microsoft Windows 2000 Adwance Server 操作系统后,开始配置每台服务器的网络。在网络连接中我们给连接公众网的 命名为"外网",连接内部网的命名为"内网"并分别指定 IP 地址为:节点 1:内网:ip:10.10.10.11 外网 ip:192.168.0.192 子网 掩码:255.255.255.0 网关:192.168.0.191(主域控制器 ip) ;节点 2:内网:ip:10.10.10.12 外网 ip:192.168.0.193 子网掩码: 255.255.255.0 网关:192.168.0.191;节点 3:内网:ip:10.10.10.13 外网 ip:192.168.0.194 子网掩码:255.255.255.0 网关: 192.168.0.191;节点 4:内网:ip:10.10.10.14 外网 ip:192.168.0.195 子网掩码:255.255.255.0 网关:192.168.0.191;节点 5: 内

M集群通信解决方案

现状分析 我国公安集群无线通信系统所采用的通信体制是集群信令系统和在“集群脑系统接口性能规范”基础上制定的编号制式。 模拟集群系统是最早引入我国的集群系统。首先,系统内部没有制定互联的标准,造成各厂商之间无法互联互通,甚至在同一省市由于存在不同厂商的模拟系统,同一地市的公安部门都无法互联互通,全国公安联网更是天方夜谭,根本无法实现;其次,由于固有的技术缺陷,移动终端无法越区切换,移动终端从某一基站覆盖范围移动到另一基站覆盖范围是通信将中断,给实际工作带来诸多不便;第三,由于数据功能和数据接口没有定义,除语音调度外,系统更多功能无法实现,单纯的对讲功能已不能满足用户的需要;第四,模拟系统专网建设需要投入较高的建设成本,每年还要投入大量的人力和资金进行维护,这不是一般的用户能够承受的;第五,随着数字移动通信技术的飞速发展以及国家加强对无线频点的管制,用户很难再申请到新频点,模拟运营面临停牌,模拟集群网已趋向淘汰。 需求说明 随着社会经济的不断发展,日常公共安全管理、重大活动勤务保障和反恐处突的需求非常迫切,公安机关对无线通信的需求不断增长,现有频率资源十分紧张,频率干扰日益严重,缺乏通信安全手段,现有模拟系统无法支持大容量数据业务(大容量的

定位等),公安无线通信难以满足同一指挥、反应快速、协调有序、安全准确、运转高效、可靠地进行通信联络和信息传输。系统在满足公安需求的前提下存在以下亟待解决的问题: ◆频率资源不足 现有模拟通信频率带宽为,可用于公安集群通信的频点仅为对,难于建设更多集群基站和信道,无法增加覆盖范围和移动用户,已经严重制约了无线通信系统的发展。 ◆信号干扰日益严重 城市无线电波传输环境越来越恶劣,对现有公安无线通信带来了直接的影响。另外,由于在部分省市公安的市区采用了模拟集群同播、模拟常规等同播系统,造成重叠区同频信号干扰严重,这不但直接影响了警务活动的效率,更可能在关键时刻造成不可挽回的损失。 ◆通信保密性差 社会治安形式日益复杂,突发事件日益增多,公安反恐维稳任务日益加重,通信安全的保障是公安机关有力打击犯罪的根本举措。现在的模拟通信通过简单的频谱扫描就可以获取通信信息,这给公安机关的通信留下巨大的隐患,对重大警务活动的安全性带来危害。 ◆系统业务扩展性差 现有模拟集群系统无法支持较大容量数据业务,除语音调度外,数据功能和数据接口没有定义,使得系统功能过于单一。如:

无线数字数集群系统具体实施方案模板.doc

天一阁·月湖景区无线集群通信指挥系统 (设计方案) 浙江宝兴智慧城市建设有限公司 二○一七年七月

目录 1 项目概述 .................................................... 错误 ! 未定义书签。 通信现状 . ............................................ 错误 ! 未定义书签。 集群通信必要性 . ...................................... 错误 ! 未定义书签。 信道利用率高 . .................................... 错误 ! 未定义书签。 业务功能丰富 . .................................... 错误 ! 未定义书签。 系统建成后可实现的功能 . .............................. 错误 ! 未定义书签。 数字集群系统的先进性 . ............................ 错误 ! 未定义书签。 2 项目总体设计方案 ............................................. 错误 ! 未定义书签。 设计目标 . ............................................ 错误 ! 未定义书签。 系统组网方案 . ........................................ 错误 ! 未定义书签。 基站建设 . ........................................ 错误 ! 未定义书签。 站点容量计算 . .................................... 错误 ! 未定义书签。 站点部署示意图 . .................................. 错误 ! 未定义书签。 系统规划 . ........................................ 错误 ! 未定义书签。 系统特点及功能介绍 . .................................. 错误 ! 未定义书签。 基本业务功能 . .................................... 错误 ! 未定义书签。 移动性管理 . .............................. 错误 ! 未定义书签。 安全功能 . ................................ 错误 ! 未定义书签。 基本话音业务 . ............................ 错误 ! 未定义书签。 基本数据业务 . ............................ 错误 ! 未定义书签。 有线调度功能 . .................................... 错误 ! 未定义书签。 语音调度功能 . ............................ 错误 ! 未定义书签。 基本业务功能 ......................... 错误 ! 未定义书签。 多选呼叫 . ............................ 错误 ! 未定义书签。 用户监听 . ............................ 错误 ! 未定义书签。 强插 / 强拆 . ........................... 错误 ! 未定义书签。 遥晕 / 复活 . ........................... 错误 ! 未定义书签。 在线检测 . ............................ 错误 ! 未定义书签。 呼叫提醒 . ............................ 错误 ! 未定义书签。 会议 . ................................ 错误 ! 未定义书签。 遥毙 . ................................ 错误 ! 未定义书签。 短信管理 . ................................ 错误 ! 未定义书签。 紧急告警 . ................................ 错误 ! 未定义书签。 录音回放 . ................................ 错误 ! 未定义书签。 报表查询 . ................................ 错误 ! 未定义书签。 数字系统网管系统 . ................................ 错误 ! 未定义书签。 3 系统设备介绍 ................................................ 错误 ! 未定义书签。 单基站示意图 . ........................................ 错误 ! 未定义书签。 信道机 . .............................................. 错误 ! 未定义书签。 产品描述 . ........................................ 错误 ! 未定义书签。 技术规格 . ........................................ 错误 ! 未定义书签。 合路器 . .............................................. 错误 ! 未定义书签。 分路器 . .............................................. 错误 ! 未定义书签。 双工器 . .............................................. 错误 ! 未定义书签。 室外全向天线 . ........................................ 错误 ! 未定义书签。 手持终端 PD680 ....................................... 错误 ! 未定义书签。

相关文档
最新文档