どこで手に入るの？

公式のgitリポジトリ
- git://git.postgresql.org/git/postgresql.git
githubのミラーリポジトリ
- https://github.com/postgres/postgres
バージョン毎のソースコード
- https://www.postgresql.org/ftp/source/

何がはいってるの？

大まかには以下のコードが入っています。

サーバのソースコード（バックエンドと呼んでます）
- src/backendの下
クライアントのソースコード（フロントエンドを呼んでいます）
- src/binの下
- psql、pgbench、pg_dumpなど
Contribのソースコード
- contribの下
- PostgreSQLサーバのコードとは別に管理されているコード
- rpmだとpostgresql-contribパッケージに相当します
ドキュメント
- docの下
リグレッションテスト
- src/testの下

`src`ディレクトリを見てみる

パス	内容
src/backend	PostgreSQLサーバのコード
src/bin	クライアントツールのコード
src/common	バックエンド、フロントエンド共通で使うコード
src/fe_utils	フロント円でで使う便利なコード(feはFrontEnd)
src/include	ヘッダファイル
src/interfaces	lipqとecpg
src/pl	plperl, plpgsql, plpythonなど
src/port	バックエンド、フロント共通の環境依存のコード
src/test	リグレッションテスト
src/timezone	タイムゾーン
src/tools	開発者のためのツール

「Backend = PostgreSQLサーバ」、「Frontend = クライアントツール」がわかればそこまで迷うことはなくなりそう。

`src/backend`ディレクトリにあるサーバ側のコードを見てみる

パス	内容
src/backend/access	テーブル、インデックスなどのDBデータにアクセスするコード（PostgreSQLではアクセスメソッドを呼んでいるので多分`access`なんだと思う）。WALや2相コミットなどのトランザクション周りのコードもここ
src/backend/bootstrap	データベースクラスタ作成時（`initdb`コマンド実行時）に使われる
src/backend/catalog	システムカタログ
src/backend/commands	`CREATE TABLE`、`COPY`などのDDLやSQLコマンド
src/backend/executor	エグゼキュータ。プランナが作成した実行計画を実行する
src/backend/foreign	外部テーブル（Foreign Data Wrapper）の基盤となるコード
src/backend/jit	JITコンパイル
src/backend/lib	バックエンドで使えるライブラリ
src/backend/libpq	lipqのサーバ側のコード
src/backend/main	postgresプロセスのmain関数
src/backend/nodes	ノードを扱う関数（比較、コピーなど）
src/backend/optimizer	オプティマイザ（プランナ）。実行計画を作る
src/backend/parser	パーサ。SQLを構文解析する
src/backend/partitioning	テーブル・パーティショニング
src/backend/po	ログメッセージの多言語対応
src/backend/port	サーバ側の環境依存コード
src/backend/postmaster	サーバプロセス（checkpointerやautovacuum launcher/worker、bg writerなど）
src/backend/regex	正規表現
src/backend/replication	物理、論理レプリケーションやレプリケーションスロット
src/backend/rewrite	リライタ。RULEやROW LEVEL SECURITYなど
src/backend/snowball	ステミングのためのsnowballライブラリ
src/backend/statistics	拡張統計情報（CREATE STATISTICSコマンド）
src/backend/tcop	Traffic Copの略。SQL処理の起点となる所
src/backend/tsearch	全文検索用のライブラリ
src/backend/utils	その他色々なコード（設定パラメータ、カタログキャッシュ、メモリ管理、各データ型の実装など）

ソースコードを読む際に知っておくと便利な関数

SQLを受け取り、処理する所

src/backend/tcop/postgres.cのexec_simple_query()

COPYやALTER TABLE等のDDLやSQLコマンドを実行する所

src/backend/tcop/utility.cのstandard_ProcessUtility()

exec_simple_query()を見ると、SQLを受信して、構文解析して、実行計画を作成して実行する、という一連の流れを見ることができます。構文解析後にそのSQLがSELECT、UPDATE、INSERT、DELETEの場合はExecutorに処理を渡し、それ以外のDDLやSQLコマンドである場合は、（最終的には）standard_ProcesUtility()に処理を引き渡します。

ソースコードを読む時に知っておくと便利な事(2020/12/15 追記)

こちらについてもアンカンファレンスで話したので追記しました。

`palloc()`と`pfree()`関数

PostgreSQL版のmalloc()、free()です。

PostgreSQLのサーバ側のコードでは、MemoryContextと呼ばれる構造を使ってメモリ管理をしています。 PostgreSQL自体C言語で書かれているので、メモリ確保と解放が必要なのですが、MemoryContextを使うといちいちメモリを解放する手間を省けます。MemoryContextは用途別（例えばトランザクション単位、タプル単位など）に存在し、階層構造を持てます。なので、親のMemoryContextが解放されると子や孫のMemoryContextも自動的に解放されます。。例えば、タプルを処理するために、トランザクション単位のMemoryContextを親とするMemoryContextを作った場合、そのトランザクションが終了すると自動的にタプル処理用のMemoryContextも解放される、といった感じです。

明示的に開放する必要がある場合は、pfree()関数を使います。ただ、pfree()関数がないからといってメモリが解放されないでいる、とは限りません。

`ereport()`と`elog()`関数

サーバログに出力するprintf()のような関数です。

第一引数にエラーレベル（ERROR、LOGなど）を指定できます。ソースコードを読む時に注意が必要なのは、ERROR、FATAL、PANICです。これらのエラーレベルでログを出した場合、その行以降のコードは実行されません。

ereport(ERROR, ...);
- 即座にAbort処理に移行します。Abort処理後は通常の状態に戻ります。
ereport(FATAL, ...)
- 即座にAbort処理を行いそのプロセスが終了します。
ereport(PANIC, ...)
- 他のプロセスも巻き込みサーバ全体がクラッシュします。再起動時はクラッシュリカバリが走ります。
- WAL領域(pg_walディレクトリ)が満杯でWALが書けなくなった時とかにPANICは発生します。

ereport()とelog()は働きはほとんど同じです。ereport()は一般的なサーバ情報を書く時に使われ、elog()はデバッグ情報や普通は起こらないはずのエラー出力に使われたりします。printfデバッグするときは、elog(NOTICE, ...)やelog(WARNING, ...)が便利です。