メインコンテンツに移動

sun0サーバ

SUN0サーバー

STATUS:運航中

(長くなりすぎたので新ページです. 旧ページはこちら

MB MSI C236A Workstation  
CPU Xeon E3-1245 v5  
Memory DDR4-2133 ECC Unbuffered (UDIMMってやつね) CT4K16G4WFD8213 16GBx4
(値段間違ってるわ〜と思ってポチったときには4万だったのに、
2日後には7万になってたwww
Amazonときどき値段間違えるから助かる)
 
RAID  
SSD SAN Disk 500GB x 2   (どこかの故障したサーバーからのゲット品だったような)  
HDD Seagate IRON Wolf 10TB x 4  ・・・2025年では24TB売ってる.
2030年には50TBが出る予定らしい.RAIDいらねえじゃん
 
Ethernet X520-T2   まだ燃えてねえと思う  

役目

  • SUNなんとか,の中で,数段抜きで最新機種(本名はig2016a)
  • ケースはボロボロだけど. まあ鉄板が錆びてもコンピュータには無関係だし
  • 地下計算機室のすべての親玉(IPAサーバ), ラスボス,MotherOfAllNodesってわけ
    • ラスボスなので出番は少ないかもねー
  • /net/sun0 を提供
  • smb共有ディスクworkを提供
  • 諸般の都合によりSQLサーバ(マリアさん)を実行
  • 諸般の都合によりいかちゃんを実行(予定)

Avago MegaRAID 9341-4i は, CentOS8/CentOS8 Stream 8.1では、UEFIからは見えません。BIOSから起動しなければダメです。お気をつけあそばせ

って知らねーよボケが!書いとけ!マニュアルに!

2024年5月,CentOS Stream8がEnd-of-Lifeでサポート終了となりました.

えええ,そのうちOS更新という大作業いないとじゃねえかよ.1台だけじゃないぞ.計算機クラスター全部ですよ.

CentOS Streamでさえ,RedHatは大変やる気がなさそうである.移転先はどこがいいかな

  • AlmaLinux 名前がダサいという問題がある
  • Rocky Linux 名前がダサいという問題がある
  • Oracle Linux 帝国の支配下に入るのもいいかもしれないな
  • Azure Linux Microsoftが作ってみたLinux

IPAが充実しているのがいいな・・・

AlmaLinux9.5

AlmaLinuxに変更することにした. ついてはデータのバックアップが必要である. なんちゃってFS sun2 にバックアップする.

/local/disk0/   6TBのユーザーデータ & mysql.back ..... バックアップ完了
/local/disk1/   mysqlデータ ........................ バックアップ完了
/root/MYSQL     バックアップ設定やらなんやら .......... バックアップ完了
/root/RAID      デバイスドライバやらなんやら  .......... バックアップ完了

 # nohup rsync -avr --bwlimit=81920   disk0/ sun2:/local/disk1/backup/sun0_disk0 &

バックアップ完了したので, OSをインストールする.

インストール

の前にIPAサーバーを引退

 引退完了. OS再インストール

インストールUSB挿して起動

まずはUEFI USBから起動してみる.8年前はそれで死んだので,今度も死んでみよう.ええっと起動デバイスの中に,SanDiskは見えるが, Avagoは見えねえな・・・あ?Bus 02 PCI Raid Adapterってのが,それか.まあええわ.OSインストールするわけじゃないしな.

UEFI USBからの起動はできるみたいね.ま,問題は,RAIDカードが見えるか.ううむ見えねえな.やっぱり?では今度はBIOSで.このタコ野郎,BIOS画面がバグりまくりで死ね.アップデートしちゃうぞ?

BIOSからの起動もできる.画面が解像度低いからすぐにわかるわ・・・で,RAIDカード見えるのかというと,見える!AVAGO MR9341-4iだそうだ.これでええわ.問題は

  • 道で拾ったSSD 500GBを2枚連続でLVMしてた(SSDぢゃけん,対故障性は捨てた.モーターは10年すれば高い確率で動作停止するが,電気が回転?しなくなる事故は少ないからである)
  • じゃけどもAVAGOは内部でハードウェア的にRAID10だったはず.どう理解してくれるんやろね?

結論として,SSD LVMは「知らねえOS」として認識され,AVAGO上のXFS18TBは,「わけわからんパーティション」であった.文句なし!

と思ったが・・・インストール終了して再起動しても,OSが起動しない.なんで?だいたいやな,起動する時のGRUBはどこに書くんだろうね,これ

とりあえず起動順序TOPは【HDD: San Disk】次が【UEFI HDD】にしてみる.で,HDD内部順は【1個目SSD】【2個目SSD】【AVAGO】にしてみる.ううん,だめやね.GRUBの書き出し先に注意しながら,もう一度インストールやね!起動順を【1個目SSD】【2個目SSD】【AVAGO】にしたまま,USBからブートってやる方がいいかもね.

今度はちゃんとブートローダのインストール先を確認した.SAN Disk  の,ケツが0503のやつだ.ううん,だめだな.

っと?おお?突如としてBIOSが中国語を喋り出したぞ.やっぱ,へんだぞこのBIOS

  • BIOS Build date 2017/12/5   Version E7998IMS.290 だそうだ.
  • で,最新のは:2018版である・

書き直してみよう.どうせ壊れとるんだからな

BIOS焼き直したので再インストール

UEFIで再チャレンジしてみる.ううん?やっぱ,AVAGOは見えない.が,試しにインストールしてみる.あとで見えたらそれでええし.

UEFIでインストールしてみる.インストール後,起動はできる.だが,MegaRAIDはガン無視であるね.まあ,ここから手動でMegaRAIDを認識させるってのは,可能性はある.

BIOSでインストールしてみる.お!起動した!AVAGOディスクも見える! 計算機室寒すぎて hostname  タイプミスっとる

FreeIPAサーバーに復帰

ここの上の方でクライアントに入った. で,ここでレプリカになった.

 復活の時は来た

QUOTAの復活

/etc/fstab編集: 赤字のところをdefaultsから変更

/dev/mapper/almalinux-root /                       xfs     defaults        0 0
UUID=b366fdea-a35b-4653-b589-12cadec2508e /boot                   xfs     defaults        0 0
UUID=054779c9-974a-4300-a9ed-1fe56feb69d6 /local/disk1            xfs      nosuid,nodev,nofail,usrquota,grpquota        0 0
/dev/mapper/almalinux-swap none                    swap    defaults        0 0

ふうん?確かにBIOSブートなので/boot/uefiがにゃいね.

# umount /local/disk1
# mount /local/disk1
mount: (hint) your fstab has been modified, but systemd still uses
       the old version; use 'systemctl daemon-reload' to reload.

ぎゃ?おじいさまは怒られましたよ. やり直したら正常でしてね.

# xfs_quota -x -c 'report -uh' /local/disk1
User ID      Used   Soft   Hard Warn/Grace
---------- ---------------------------------
root       480.1G      0      0  00 [------]
work         1.2T     2T     2T  00 [------]
shoeji          0     1G     1G  00 [------]
kuni            0     1G     1G  00 [------]
tanaka      65.9G   100G   100G  00 [------]
chie       898.5M    10G    10G  00 [------]
shima        2.2T     3T     3T  00 [------]
hira         4.2G    10G    10G  00 [------]
shogo       47.7G    48G    50G  00 [------]
sugimoto     1.3T   4.9T   5.0T  00 [------]
namiki      29.2M     1G     1G  00 [------]
kota         1.0G     2G     2G  00 [------]
mori        12.0G    20G    20G  00 [------]
hiro            0     1G     1G  00 [------]
kame            0     1G     1G  00 [------]
yoshi           0     1G     1G  00 [------]
naga         1.1G     1G     1G  00 [-none-]
satake         4K     1G     1G  00 [------]
sae          2.5M     1G     1G  00 [------]
koba398       24K     1G     1G  00 [------]
naoya      283.2G   300G   300G  00 [------]
tomoyuki    20.4G    21G    22G  00 [------]
shsyknt33  149.8G   200G   200G  00 [------]
hibiki       8.9G    10G    10G  00 [------]

ちょびちょびみんな使ってるのは work フォルダーでしょうねえ.

ファイルサーバ復活

んだばここにしたがって /net/sun0 のふっかちゅ♪

Firewalld停止

MPI利用のためFirewall停止

# xsystemctl disable firewalld
# xsystemctl stop firewalld

Libraryインストール

ここの下の方で色々準備ね. ふっかちゅ♪

[root@sun0 thirdparty]# make all
gsl 2.6-7.el9
cmake 3.26.5-2.el9
bzip2-devel 1.0.8-10.el9_5
epel-release 9-9.el9
p7zip 16.02-31.el9
python-devel 3.9.21-1.el9_5
boost boost_1_85_0
libXt 1.2.0-6.el9
libopengl 1:1.3.4-1.el9
vtk v9.4.1
blas 3.9.0-10.el9
gmp 1:6.2.0-13.el9
mpfr 4.1.0-7.el9
eigen 3.4.0
ntl 11.5.1
cgal v6.0.1
calc 2.14.0.14-1.el9
nkf 1:2.1.4-23.el9
gfortran 11.5.0-5.el9_5.alma.1
openssl 1:3.2.2-6.el9_5.1
munge 0.5.13-13.el9
selinux disabled
maria 3:10.5.27-1.el9_5
httpd 2.4.62-1.el9_5.2
mailx 14.9.22-6.el9
readline 8.1-4.el9
pam 1.5.1-22.el9_5
libcurl 7.76.1-31.el9
libevent-devel 2.1.12-8.el9_4
hwloc 2.4.1-5.el9
openpmix v5.0.7
dbus-devel 1:1.12.20-8.el9
slurm slurm-24-11-3-1
ompi v5.0.7
gmpfrxx gmpfrxx
boost-mpi boost_1_85_0
cryptopp 8.6.0-1.el9
lapack 3.9.0-10.el9
log4cplus 2.0.5-15.el9
maria-devel 3:10.5.27-1.el9_5
mysqlpp mysql++-3.3.0
php 1:1.10.14-1.el9
libpng 2:1.6.37-12.el9
libXaw 1.0.13-19.el9
texinfo 6.7-15.el9
plotutils 2.6.fd7
ImageMagick 6.9.13.17-1.el9
mpreal mpfrc++-3.7.1
fftw 3.3.8-12.el9

復活のMaria

こんどはMariaBackupで行けるんだよね.避難先sun3で

sun3 # systemctrl stop mariadb   ←かなーり待った
sun3 # mkdir /local/disk0/mariabackup
sun3 # systemctrl start mariadb
sun3 # mariabackup --backup --target-dir /local/disk0/mariabackup/ -u root -p いつもの
うにゃうにゃうにゃ
[00] 2025-04-09 12:50:51 Redo log (from LSN 349867221396 to 349867221408) was copied.
[00] 2025-04-09 12:50:51 completed OK!

さあて,この間に,新居の準備っすよね.インストール直後なんで, /etc/my.conf.d/mariadb-server.conf によると /var/lib/mysql がフォルダーであるようだ.

sun0 # systemctrl stop mariadb
sun0 # rsync -avr /var/lib/mysql/ /local/disk0/SQL/
sun0 # systemctrl start mariadb
sun0 # mysql -h localhost -u root
MariaDB> quit;

うん.動いてますねえ.じゃ,バックアップを転送して復元:

sun0 # rsync -avr sun3:/local/disk0/mariabackup /local/disk0/mariabackupo
sun0 # systemctl stop mariadb
sun0 # rm -rf /local/disk0/SQL/*
sun0 # mariabackup --prepare --target-dir /local/disk0/mariabackupo/mariabackup/ -u root -p いつもの
ariabackup based on MariaDB server 10.5.27-MariaDB Linux (x86_64)
[00] 2025-04-09 17:28:25 cd to /local/disk0/mariabackupo/mariabackup/
[00] 2025-04-09 17:28:25 open files limit requested 0, set to 1024
[00] 2025-04-09 17:28:25 This target seems to be already prepared.
[00] 2025-04-09 17:28:25 mariabackup: using the following InnoDB configuration for recovery:
[00] 2025-04-09 17:28:25 innodb_data_home_dir = .
[00] 2025-04-09 17:28:25 innodb_data_file_path = ibdata1:10M:autoextend
[00] 2025-04-09 17:28:25 innodb_log_group_home_dir = .
[00] 2025-04-09 17:28:25 InnoDB: Using Linux native AIO
[00] 2025-04-09 17:28:25 Starting InnoDB instance for recovery.
[00] 2025-04-09 17:28:25 mariabackup: Using 104857600 bytes for buffer pool (set by --use-memory parameter)
2025-04-09 17:28:25 0 [Note] InnoDB: Uses event mutexes
2025-04-09 17:28:25 0 [Note] InnoDB: Compressed tables use zlib 1.2.11
2025-04-09 17:28:25 0 [Note] InnoDB: Number of pools: 1
2025-04-09 17:28:25 0 [Note] InnoDB: Using crc32 + pclmulqdq instructions
2025-04-09 17:28:25 0 [Note] InnoDB: Using Linux native AIO
2025-04-09 17:28:25 0 [Note] InnoDB: Initializing buffer pool, total size = 104857600, chunk size = 104857600
2025-04-09 17:28:25 0 [Note] InnoDB: Completed initialization of buffer pool
[00] 2025-04-09 17:28:25 Last binlog file , position 0
[00] 2025-04-09 17:28:25 completed OK!
sun0 # mariabackup --copy-back --target-dir /local/disk0/mariabackupo/mariabackup/ -u root -p いつもの
[01] 2025-04-09 17:28:40 Copying ./aria_log.00000001 to /local/disk0/SQL/aria_log.00000001
....
[00] 2025-04-09 17:20:43 completed OK!
# find /local/disk0/SQL -exec chown mysql {} \;
# find /local/disk0/SQL -exec chgrp mysql {} \;
# systemctl start mariadb

ん?これでいいのは,もしかしてbackup元のデータが src-host:/local/disk0/SQL で, restore先が dest-host:/local/disk0/SQL の場合だけかもしれないが.ま,ええか.繋がるかな

うむ!いいようであるね.では自動バックアップを設定しよう.

sun0 # crontab -e
01 03 * * 1 /root/MYSQL/backup.sh phase_03
31 02 1 * * /root/MYSQL/backup.sh phase_01
31 02 2 * * /root/MYSQL/backup.sh phase_02
31 02 3 * * /root/MYSQL/backup.sh mysql

これで, mysql, phase_01, phase_02は月に一度, phase_03は毎週バックアップする.

学外からのSSH

完了

Webサーバ

データ復元!

SMBサーバ

/etc/samba/smb.conf を復元.

接続成功

pdbedit -a お前の名前   で,個人のホームディレクトリにもアクセスできた

RAID監視ツール

あり?年月が経ちすぎて, ソフトが変わってしまっちょる. 

sun0 # Raid.sh
RAID> p 0 t
DRIVE MODEL GB Temp Merr Oerr
/c0/e62/s0 ST10000VN0008-2JJ101 9.095 29C 0 0
/c0/e62/s1 ST10000VN0004-1ZD101 9.095 30C 0 0
/c0/e62/s2 ST10000VN000-3AK101 9.095 35C 0 0
/c0/e62/s3 ST10000VN0008-2JJ101 9.095 29C 0 0

ま,これだけあれば,当座は凌げるよね.

動作確認後,sun2のバックアップファイル消去すべしよ

 

 

File attachments
添付 サイズ
StorCLI_RefMan_revf.pdf 870.64 KB