SUN0サーバー
STATUS:運航中
(長くなりすぎたので新ページです. 旧ページはこちら)
MB | MSI C236A Workstation | |
---|---|---|
CPU | Xeon E3-1245 v5 | |
Memory | DDR4-2133 ECC Unbuffered (UDIMMってやつね) CT4K16G4WFD8213 16GBx4 (値段間違ってるわ〜と思ってポチったときには4万だったのに、 2日後には7万になってたwww Amazonときどき値段間違えるから助かる) |
|
RAID |
|
|
SSD | SAN Disk 500GB x 2 (どこかの故障したサーバーからのゲット品だったような) | |
HDD | Seagate IRON Wolf 10TB x 4 ・・・2025年では24TB売ってる. 2030年には50TBが出る予定らしい.RAIDいらねえじゃん |
|
Ethernet | X520-T2 まだ燃えてねえと思う |
役目
- SUNなんとか,の中で,数段抜きで最新機種(本名はig2016a)
- ケースはボロボロだけど. まあ鉄板が錆びてもコンピュータには無関係だし
- 地下計算機室のすべての親玉(IPAサーバ), ラスボス,MotherOfAllNodesってわけ
- ラスボスなので出番は少ないかもねー
- /net/sun0 を提供
- smb共有ディスクworkを提供
- 諸般の都合によりSQLサーバ(マリアさん)を実行
- 諸般の都合によりいかちゃんを実行(予定)
Avago MegaRAID 9341-4i は, CentOS8/CentOS8 Stream 8.1では、UEFIからは見えません。BIOSから起動しなければダメです。お気をつけあそばせ
って知らねーよボケが!書いとけ!マニュアルに!
2024年5月,CentOS Stream8がEnd-of-Lifeでサポート終了となりました.
えええ,そのうちOS更新という大作業いないとじゃねえかよ.1台だけじゃないぞ.計算機クラスター全部ですよ.
CentOS Streamでさえ,RedHatは大変やる気がなさそうである.移転先はどこがいいかな
- AlmaLinux 名前がダサいという問題がある
- Rocky Linux 名前がダサいという問題がある
- Oracle Linux 帝国の支配下に入るのもいいかもしれないな
- Azure Linux Microsoftが作ってみたLinux
IPAが充実しているのがいいな・・・
AlmaLinux9.5
AlmaLinuxに変更することにした. ついてはデータのバックアップが必要である. なんちゃってFS sun2 にバックアップする.
/local/disk0/ 6TBのユーザーデータ & mysql.back ..... バックアップ完了 /local/disk1/ mysqlデータ ........................ バックアップ完了 /root/MYSQL バックアップ設定やらなんやら .......... バックアップ完了 /root/RAID デバイスドライバやらなんやら .......... バックアップ完了
# nohup rsync -avr --bwlimit=81920 disk0/ sun2:/local/disk1/backup/sun0_disk0 &
バックアップ完了したので, OSをインストールする.
インストール
の前にIPAサーバーを引退
引退完了. OS再インストール
インストールUSB挿して起動
まずはUEFI USBから起動してみる.8年前はそれで死んだので,今度も死んでみよう.ええっと起動デバイスの中に,SanDiskは見えるが, Avagoは見えねえな・・・あ?Bus 02 PCI Raid Adapterってのが,それか.まあええわ.OSインストールするわけじゃないしな.
UEFI USBからの起動はできるみたいね.ま,問題は,RAIDカードが見えるか.ううむ見えねえな.やっぱり?では今度はBIOSで.このタコ野郎,BIOS画面がバグりまくりで死ね.アップデートしちゃうぞ?
BIOSからの起動もできる.画面が解像度低いからすぐにわかるわ・・・で,RAIDカード見えるのかというと,見える!AVAGO MR9341-4iだそうだ.これでええわ.問題は
- 道で拾ったSSD 500GBを2枚連続でLVMしてた(SSDぢゃけん,対故障性は捨てた.モーターは10年すれば高い確率で動作停止するが,電気が回転?しなくなる事故は少ないからである)
- じゃけどもAVAGOは内部でハードウェア的にRAID10だったはず.どう理解してくれるんやろね?
結論として,SSD LVMは「知らねえOS」として認識され,AVAGO上のXFS18TBは,「わけわからんパーティション」であった.文句なし!
と思ったが・・・インストール終了して再起動しても,OSが起動しない.なんで?だいたいやな,起動する時のGRUBはどこに書くんだろうね,これ
とりあえず起動順序TOPは【HDD: San Disk】次が【UEFI HDD】にしてみる.で,HDD内部順は【1個目SSD】【2個目SSD】【AVAGO】にしてみる.ううん,だめやね.GRUBの書き出し先に注意しながら,もう一度インストールやね!起動順を【1個目SSD】【2個目SSD】【AVAGO】にしたまま,USBからブートってやる方がいいかもね.
今度はちゃんとブートローダのインストール先を確認した.SAN Disk の,ケツが0503のやつだ.ううん,だめだな.
っと?おお?突如としてBIOSが中国語を喋り出したぞ.やっぱ,へんだぞこのBIOS
- BIOS Build date 2017/12/5 Version E7998IMS.290 だそうだ.
- で,最新のは:2018版である・
書き直してみよう.どうせ壊れとるんだからな
BIOS焼き直したので再インストール
UEFIで再チャレンジしてみる.ううん?やっぱ,AVAGOは見えない.が,試しにインストールしてみる.あとで見えたらそれでええし.
UEFIでインストールしてみる.インストール後,起動はできる.だが,MegaRAIDはガン無視であるね.まあ,ここから手動でMegaRAIDを認識させるってのは,可能性はある.
BIOSでインストールしてみる.お!起動した!AVAGOディスクも見える! 計算機室寒すぎて hostname タイプミスっとる
FreeIPAサーバーに復帰
ここの上の方でクライアントに入った. で,ここでレプリカになった.
復活の時は来た
QUOTAの復活
/etc/fstab編集: 赤字のところをdefaultsから変更
/dev/mapper/almalinux-root / xfs defaults 0 0
UUID=b366fdea-a35b-4653-b589-12cadec2508e /boot xfs defaults 0 0
UUID=054779c9-974a-4300-a9ed-1fe56feb69d6 /local/disk1 xfs nosuid,nodev,nofail,usrquota,grpquota 0 0
/dev/mapper/almalinux-swap none swap defaults 0 0
ふうん?確かにBIOSブートなので/boot/uefiがにゃいね.
# umount /local/disk1 # mount /local/disk1 mount: (hint) your fstab has been modified, but systemd still uses the old version; use 'systemctl daemon-reload' to reload.
ぎゃ?おじいさまは怒られましたよ. やり直したら正常でしてね.
# xfs_quota -x -c 'report -uh' /local/disk1
User ID Used Soft Hard Warn/Grace
---------- ---------------------------------
root 480.1G 0 0 00 [------]
work 1.2T 2T 2T 00 [------]
shoeji 0 1G 1G 00 [------]
kuni 0 1G 1G 00 [------]
tanaka 65.9G 100G 100G 00 [------]
chie 898.5M 10G 10G 00 [------]
shima 2.2T 3T 3T 00 [------]
hira 4.2G 10G 10G 00 [------]
shogo 47.7G 48G 50G 00 [------]
sugimoto 1.3T 4.9T 5.0T 00 [------]
namiki 29.2M 1G 1G 00 [------]
kota 1.0G 2G 2G 00 [------]
mori 12.0G 20G 20G 00 [------]
hiro 0 1G 1G 00 [------]
kame 0 1G 1G 00 [------]
yoshi 0 1G 1G 00 [------]
naga 1.1G 1G 1G 00 [-none-]
satake 4K 1G 1G 00 [------]
sae 2.5M 1G 1G 00 [------]
koba398 24K 1G 1G 00 [------]
naoya 283.2G 300G 300G 00 [------]
tomoyuki 20.4G 21G 22G 00 [------]
shsyknt33 149.8G 200G 200G 00 [------]
hibiki 8.9G 10G 10G 00 [------]
ちょびちょびみんな使ってるのは work フォルダーでしょうねえ.
ファイルサーバ復活
んだばここにしたがって /net/sun0 のふっかちゅ♪
Firewalld停止
MPI利用のためFirewall停止
# xsystemctl disable firewalld
# xsystemctl stop firewalld
Libraryインストール
ここの下の方で色々準備ね. ふっかちゅ♪
[root@sun0 thirdparty]# make all
gsl 2.6-7.el9
cmake 3.26.5-2.el9
bzip2-devel 1.0.8-10.el9_5
epel-release 9-9.el9
p7zip 16.02-31.el9
python-devel 3.9.21-1.el9_5
boost boost_1_85_0
libXt 1.2.0-6.el9
libopengl 1:1.3.4-1.el9
vtk v9.4.1
blas 3.9.0-10.el9
gmp 1:6.2.0-13.el9
mpfr 4.1.0-7.el9
eigen 3.4.0
ntl 11.5.1
cgal v6.0.1
calc 2.14.0.14-1.el9
nkf 1:2.1.4-23.el9
gfortran 11.5.0-5.el9_5.alma.1
openssl 1:3.2.2-6.el9_5.1
munge 0.5.13-13.el9
selinux disabled
maria 3:10.5.27-1.el9_5
httpd 2.4.62-1.el9_5.2
mailx 14.9.22-6.el9
readline 8.1-4.el9
pam 1.5.1-22.el9_5
libcurl 7.76.1-31.el9
libevent-devel 2.1.12-8.el9_4
hwloc 2.4.1-5.el9
openpmix v5.0.7
dbus-devel 1:1.12.20-8.el9
slurm slurm-24-11-3-1
ompi v5.0.7
gmpfrxx gmpfrxx
boost-mpi boost_1_85_0
cryptopp 8.6.0-1.el9
lapack 3.9.0-10.el9
log4cplus 2.0.5-15.el9
maria-devel 3:10.5.27-1.el9_5
mysqlpp mysql++-3.3.0
php 1:1.10.14-1.el9
libpng 2:1.6.37-12.el9
libXaw 1.0.13-19.el9
texinfo 6.7-15.el9
plotutils 2.6.fd7
ImageMagick 6.9.13.17-1.el9
mpreal mpfrc++-3.7.1
fftw 3.3.8-12.el9
復活のMaria
こんどはMariaBackupで行けるんだよね.避難先sun3で
sun3 # systemctrl stop mariadb ←かなーり待った
sun3 # mkdir /local/disk0/mariabackup
sun3 # systemctrl start mariadb
sun3 # mariabackup --backup --target-dir /local/disk0/mariabackup/ -u root -p いつもの
うにゃうにゃうにゃ
[00] 2025-04-09 12:50:51 Redo log (from LSN 349867221396 to 349867221408) was copied.
[00] 2025-04-09 12:50:51 completed OK!
さあて,この間に,新居の準備っすよね.インストール直後なんで, /etc/my.conf.d/mariadb-server.conf によると /var/lib/mysql がフォルダーであるようだ.
sun0 # systemctrl stop mariadb
sun0 # rsync -avr /var/lib/mysql/ /local/disk0/SQL/
sun0 # systemctrl start mariadb
sun0 # mysql -h localhost -u root
MariaDB> quit;
うん.動いてますねえ.じゃ,バックアップを転送して復元:
sun0 # rsync -avr sun3:/local/disk0/mariabackup /local/disk0/mariabackupo
sun0 # systemctl stop mariadb
sun0 # rm -rf /local/disk0/SQL/*
sun0 # mariabackup --prepare --target-dir /local/disk0/mariabackupo/mariabackup/ -u root -p いつもの
ariabackup based on MariaDB server 10.5.27-MariaDB Linux (x86_64)
[00] 2025-04-09 17:28:25 cd to /local/disk0/mariabackupo/mariabackup/
[00] 2025-04-09 17:28:25 open files limit requested 0, set to 1024
[00] 2025-04-09 17:28:25 This target seems to be already prepared.
[00] 2025-04-09 17:28:25 mariabackup: using the following InnoDB configuration for recovery:
[00] 2025-04-09 17:28:25 innodb_data_home_dir = .
[00] 2025-04-09 17:28:25 innodb_data_file_path = ibdata1:10M:autoextend
[00] 2025-04-09 17:28:25 innodb_log_group_home_dir = .
[00] 2025-04-09 17:28:25 InnoDB: Using Linux native AIO
[00] 2025-04-09 17:28:25 Starting InnoDB instance for recovery.
[00] 2025-04-09 17:28:25 mariabackup: Using 104857600 bytes for buffer pool (set by --use-memory parameter)
2025-04-09 17:28:25 0 [Note] InnoDB: Uses event mutexes
2025-04-09 17:28:25 0 [Note] InnoDB: Compressed tables use zlib 1.2.11
2025-04-09 17:28:25 0 [Note] InnoDB: Number of pools: 1
2025-04-09 17:28:25 0 [Note] InnoDB: Using crc32 + pclmulqdq instructions
2025-04-09 17:28:25 0 [Note] InnoDB: Using Linux native AIO
2025-04-09 17:28:25 0 [Note] InnoDB: Initializing buffer pool, total size = 104857600, chunk size = 104857600
2025-04-09 17:28:25 0 [Note] InnoDB: Completed initialization of buffer pool
[00] 2025-04-09 17:28:25 Last binlog file , position 0
[00] 2025-04-09 17:28:25 completed OK!
sun0 # mariabackup --copy-back --target-dir /local/disk0/mariabackupo/mariabackup/ -u root -p いつもの
[01] 2025-04-09 17:28:40 Copying ./aria_log.00000001 to /local/disk0/SQL/aria_log.00000001
....
[00] 2025-04-09 17:20:43 completed OK!
# find /local/disk0/SQL -exec chown mysql {} \;
# find /local/disk0/SQL -exec chgrp mysql {} \;
# systemctl start mariadb
ん?これでいいのは,もしかしてbackup元のデータが src-host:/local/disk0/SQL で, restore先が dest-host:/local/disk0/SQL の場合だけかもしれないが.ま,ええか.繋がるかな
うむ!いいようであるね.では自動バックアップを設定しよう.
sun0 # crontab -e
01 03 * * 1 /root/MYSQL/backup.sh phase_03
31 02 1 * * /root/MYSQL/backup.sh phase_01
31 02 2 * * /root/MYSQL/backup.sh phase_02
31 02 3 * * /root/MYSQL/backup.sh mysql
これで, mysql, phase_01, phase_02は月に一度, phase_03は毎週バックアップする.
学外からのSSH
完了
Webサーバ
データ復元!
SMBサーバ
/etc/samba/smb.conf を復元.
接続成功
pdbedit -a お前の名前 で,個人のホームディレクトリにもアクセスできた
RAID監視ツール
あり?年月が経ちすぎて, ソフトが変わってしまっちょる.
sun0 # Raid.sh
RAID> p 0 t
DRIVE MODEL GB Temp Merr Oerr
/c0/e62/s0 ST10000VN0008-2JJ101 9.095 29C 0 0
/c0/e62/s1 ST10000VN0004-1ZD101 9.095 30C 0 0
/c0/e62/s2 ST10000VN000-3AK101 9.095 35C 0 0
/c0/e62/s3 ST10000VN0008-2JJ101 9.095 29C 0 0
ま,これだけあれば,当座は凌げるよね.
動作確認後,sun2のバックアップファイル消去すべしよ
添付 | サイズ |
---|---|
StorCLI_RefMan_revf.pdf | 870.64 KB |