重要

このページは英語版のページを機械翻訳しています。原文はこちらからご覧ください。

TiDB で HAProxy を使用するためのベストプラクティス

このドキュメントでは、TiDB におけるHAプロキシの構成と使用に関するベストプラクティスについて説明します。HAProxy は、TCP ベースのアプリケーションの負荷分散を提供します。TiDB クライアントからは、HAProxy によって提供されるフローティング仮想 IP アドレスに接続するだけでデータを操作できるため、TiDBサーバーレイヤーでの負荷分散を実現できます。

HAProxy Best Practices in TiDB

注記：
すべてのバージョンの TiDB で動作する HAProxy の最小バージョンは v1.5 です。v1.5 と v2.1 の間では、 mysql-checkのpost-41オプションを設定する必要があります。HAProxy v2.2 以降を使用することをお勧めします。

HAProxy の概要

HAProxy は、C 言語で書かれた無料のオープンソースソフトウェアで、TCP および HTTP ベースのアプリケーションに高可用性ロードバランサーとプロキシサーバーを提供します。CPU とメモリを高速かつ効率的に使用できるため、HAProxy は現在、GitHub、Bitbucket、Stack Overflow、Reddit、Tumblr、Twitter、Tuenti、AWS (Amazon Web Services) などの多くの有名な Web サイトで広く使用されています。

HAProxy は、Linux カーネルのコアコントリビューターである Willy Tarreau によって 2000 年に作成されました。彼は現在もプロジェクトのメンテナンスを担当し、オープンソースコミュニティで無料のソフトウェアアップデートを提供しています。このガイドでは、HAProxy 2.6を使用します。最新の安定バージョンを使用することをお勧めします。詳細については、 HAProxyのリリースバージョンを参照してください。

基本的な機能

高可用性 : HAProxy は、正常なシャットダウンとシームレスな切り替えをサポートし、高可用性を提供します。
負荷分散 : 2 つの主要なプロキシモード (レイヤー4 とも呼ばれる TCP とレイヤー7 とも呼ばれる HTTP) がサポートされています。ラウンドロビン、Leastconn、ランダムなど、9 種類以上の負荷分散アルゴリズムがサポートされています。
健康診断 : HAProxy はサーバーの HTTP または TCP モードのステータスを定期的にチェックします。
スティッキーセッション : アプリケーションがスティッキーセッションをサポートしていない間、HAProxy はクライアントを特定のサーバーに固定できます。
証明書 : HTTPS 通信と解決がサポートされます。
監視と統計：Web ページを通じて、サービスの状態とトラフィックフローをリアルタイムで監視できます。

あなたが始める前に

HAProxy をデプロイする前に、ハードウェアとソフトウェアの要件を満たしていることを確認してください。

ハードウェア要件

HAProxy ドキュメントによると、HAProxy の最小ハードウェア構成は次の表のようになります。Sysbench oltp_read_writeワークロードでは、この構成の最大 QPS は約 50K です。負荷分散環境に応じてサーバー構成を増やすことができます。

ハードウェアリソース	最小仕様
CPU	2 コア、3.5 GHz
メモリ	4ギガバイト
ストレージ	50 GB (SATA)
ネットワークインターフェースカード	10G ネットワークカード

ソフトウェア要件

以下のオペレーティングシステムを使用し、必要な依存関係がインストールされていることを確認してください。yum を使用して HAProxy をインストールすると、依存関係も一緒にインストールされるため、再度個別にインストールする必要はありません。

オペレーティングシステム

Linuxディストリビューション	バージョン
レッドハットエンタープライズリナックス	7または8
セントOS	7または8
Oracle エンタープライズ Linux	7または8
Ubuntu 16.04 リリース	18.04以降のバージョン

注記：
サポートされているその他のオペレーティングシステムの詳細については、 HAProxy ドキュメント参照してください。

依存関係

エペルリリース
グーグル
システム開発

上記の依存関係をインストールするには、次のコマンドを実行します。

yum -y install epel-release gcc systemd-devel

HAProxyをデプロイ

HAProxy を使用すると、負荷分散されたデータベース環境を簡単に構成およびセットアップできます。このセクションでは、一般的なデプロイメント操作について説明します。実際のシナリオに基づいて設定ファイルをカスタマイズできます。

HAProxyをインストールする

HAProxy 2.6.2 ソースコードのパッケージをダウンロードします。
```
wget https://www.haproxy.org/download/2.6/src/haproxy-2.6.2.tar.gz
```
パッケージを抽出します:
```
tar zxf haproxy-2.6.2.tar.gz
```

ソースコードからアプリケーションをコンパイルします。

cd haproxy-2.6.2
make clean
make -j 8 TARGET=linux-glibc USE_THREAD=1
make PREFIX=${/app/haproxy} SBINDIR=${/app/haproxy/bin} install  # Replace `${/app/haproxy}` and `${/app/haproxy/bin}` with your custom directories.

プロファイルを再構成します。

echo 'export PATH=/app/haproxy/bin:$PATH' >> /etc/profile
. /etc/profile

インストールが成功したかどうかを確認します。
```
which haproxy
```

HAProxyコマンド

キーワードとその基本的な使用方法のリストを印刷するには、次のコマンドを実行します。

haproxy --help

オプション	説明
`-v`	バージョンとビルドの日付を報告します。
`-vv`	バージョン、ビルドオプション、ライブラリバージョン、使用可能なポーラーを表示します。
`-d`	デバッグモードを有効にします。
`-db`	バックグラウンドモードとマルチプロセスモードを無効にします。
`-dM [<byte>]`	メモリポイズニングを強制します。つまり、malloc() または pool_alloc2() で割り当てられたすべてのメモリ領域は、呼び出し元に渡される前に`<byte>`で埋められます。
`-V`	詳細モードを有効にします (静音モードを無効にします)。
`-D`	デーモンとして起動します。
`-C <dir>`	設定ファイルを読み込む前にディレクトリ`<dir>`に変更します。
`-W`	マスターワーカーモード。
`-q`	「quiet」モードを設定します。これにより、構成の解析中および起動中に一部のメッセージが無効になります。
`-c`	バインドを試みる前に、構成ファイルのチェックのみを実行して終了します。
`-n <limit>`	プロセスごとの接続制限を`<limit>`に制限します。
`-m <limit>`	すべてのプロセスにわたって割り当て可能なメモリの合計を`<limit>`メガバイトに制限します。
`-N <limit>`	組み込みのデフォルト値 (通常は 2000) ではなく、プロキシごとのデフォルトの maxconn を`<limit>`に設定します。
`-L <name>`	ローカルピア名を`<name>`に変更します。デフォルトでは、ローカルホスト名になります。
`-p <file>`	起動時にすべてのプロセスの PID を`<file>`に書き込みます。
`-de`	epoll(7)の使用を無効にします。epoll(7)はLinux 2.6および一部のカスタムLinux 2.4システムでのみ利用可能です。
`-dp`	poll(2) の使用を無効にします。代わりに select(2) が使用される場合があります。
`-dS`	古いカーネルでは壊れているsplice(2)の使用を無効にします。
`-dR`	SO_REUSEPORT の使用を無効にします。
`-dr`	サーバーアドレス解決の失敗を無視します。
`-dV`	サーバー側での SSL 検証を無効にします。
`-sf <pidlist>`	起動後に pidlist 内の PID に「終了」シグナルを送信します。このシグナルを受信したプロセスは、すべてのセッションが終了するまで待機してから終了します。このオプションは最後に指定する必要があり、その後に任意の数の PID が続きます。技術的には、SIGTTOU と SIGUSR1 が送信されます。
`-st <pidlist>`	起動後に pidlist 内の PID に「終了」シグナルを送信します。このシグナルを受信したプロセスは直ちに終了し、すべてのアクティブなセッションが閉じられます。このオプションは最後に指定する必要があり、その後に任意の数の PID が続きます。技術的には、SIGTTOU と SIGTERM が送信されます。
`-x <unix_socket>`	指定されたソケットに接続し、古いプロセスからすべてのリスニングソケットを取得します。次に、新しいソケットをバインドする代わりに、これらのソケットが使用されます。
`-S <bind>[,<bind_options>...]`	マスターワーカーモードでは、マスター CLI を作成します。この CLI により、すべてのワーカーの CLI にアクセスできます。デバッグに役立ち、終了するプロセスにアクセスする便利な方法です。

HAProxy コマンドラインオプションの詳細については、 HAProxy の管理ガイドおよびHAProxy の一般コマンドマニュアルを参照してください。

HAProxy を構成する

yum を使用して HAProxy をインストールすると、構成テンプレートが生成されます。シナリオに応じて、次の構成項目をカスタマイズすることもできます。

global                                     # Global configuration.
   log         127.0.0.1 local2            # Global syslog servers (up to two).
   chroot      /var/lib/haproxy            # Changes the current directory and sets superuser privileges for the startup process to improve security.
   pidfile     /var/run/haproxy.pid        # Writes the PIDs of HAProxy processes into this file.
   maxconn     4096                        # The maximum number of concurrent connections for a single HAProxy process. It is equivalent to the command-line argument "-n".
   nbthread    48                          # The maximum number of threads. (The upper limit is equal to the number of CPUs)
   user        haproxy                     # Same with the UID parameter.
   group       haproxy                     # Same with the GID parameter. A dedicated user group is recommended.
   daemon                                  # Makes the process fork into background. It is equivalent to the command line "-D" argument. It can be disabled by the command line "-db" argument.
   stats socket /var/lib/haproxy/stats     # The directory where statistics output is saved.

defaults                                   # Default configuration.
   log global                              # Inherits the settings of the global configuration.
   retries 2                               # The maximum number of retries to connect to an upstream server. If the number of connection attempts exceeds the value, the backend server is considered unavailable.
   timeout connect  2s                     # The maximum time to wait for a connection attempt to a backend server to succeed. It should be set to a shorter time if the server is located on the same LAN as HAProxy.
   timeout client 30000s                   # The maximum inactivity time on the client side.
   timeout server 30000s                   # The maximum inactivity time on the server side.

listen admin_stats                         # The name of the Stats page reporting information from frontend and backend. You can customize the name according to your needs.
   bind 0.0.0.0:8080                       # The listening port.
   mode http                               # The monitoring mode.
   option httplog                          # Enables HTTP logging.
   maxconn 10                              # The maximum number of concurrent connections.
   stats refresh 30s                       # Automatically refreshes the Stats page every 30 seconds.
   stats uri /haproxy                      # The URL of the Stats page.
   stats realm HAProxy                     # The authentication realm of the Stats page.
   stats auth admin:pingcap123             # User name and password in the Stats page. You can have multiple user names.
   stats hide-version                      # Hides the version information of HAProxy on the Stats page.
   stats admin if TRUE                     # Manually enables or disables the backend server (supported in HAProxy 1.4.9 or later versions).

listen tidb-cluster                        # Database load balancing.
   bind 0.0.0.0:3390                       # The Floating IP address and listening port.
   mode tcp                                # HAProxy uses layer 4, the transport layer.
   balance leastconn                       # The server with the smallest number of connections receives the connection. "leastconn" is recommended where long sessions are expected, such as LDAP, SQL and TSE, rather than protocols using short sessions, such as HTTP. The algorithm is dynamic, which means that server weights might be adjusted on the fly for slow starts for instance.
   server tidb-1 10.9.18.229:4000 check inter 2000 rise 2 fall 3       # Detects port 4000 at a frequency of once every 2000 milliseconds. If it is detected as successful twice, the server is considered available; if it is detected as failed three times, the server is considered unavailable.
   server tidb-2 10.9.39.208:4000 check inter 2000 rise 2 fall 3
   server tidb-3 10.9.64.166:4000 check inter 2000 rise 2 fall 3

SHOW PROCESSLIST使用して送信元 IP アドレスを確認するには、 PROXYプロトコル TiDB に接続するように構成する必要があります。

   server tidb-1 10.9.18.229:4000 send-proxy check inter 2000 rise 2 fall 3       
   server tidb-2 10.9.39.208:4000 send-proxy check inter 2000 rise 2 fall 3
   server tidb-3 10.9.64.166:4000 send-proxy check inter 2000 rise 2 fall 3

注記：
PROXY プロトコルを使用する前に、TiDBサーバーの構成ファイルでproxy-protocol.networksを構成する必要があります。

HAProxyを起動する

HAProxy を起動するには、 haproxy実行します。デフォルトでは/etc/haproxy/haproxy.cfgが読み込まれます (推奨)。

haproxy -f /etc/haproxy/haproxy.cfg

HAProxyを停止する

HAProxy を停止するには、 kill -9コマンドを使用します。

次のコマンドを実行します。
```
ps -ef | grep haproxy
```
HAProxy のプロセスを終了します。
```
kill -9 ${haproxy.pid}
```

TiDB で HAProxy を使用するためのベスト プラクティス