先日発売された『実践Apache Iceberg —— 高効率・高生産性を実現するオープンなデータ基盤の構築と運用』を献本していただいておりました。微力ながら宣伝に協力させていただきたいと思い、この記事を書いています。
『実践Apache Iceberg』が取り扱う内容は幅広く、データレイクアーキテクチャの説明やその課題、Apache Icebergの内部構造や機能の解説、Apache Spark、Apache Flink、Trino、Apache HiveからIcebergテーブルへアクセスする方法、PythonベースのCLIツールであるPyIceberg、現実に即したユースケースや運用方法の紹介、高度な最適化機能の解説を含みます。付録としてハンズオン用のDocker Compose設定ファイルも提供されており、サンドボックス環境で実際にコマンドを実行しながら学ぶことができます。現時点でのIceberg習熟度にかかわらず、誰にとっても読みどころのある一冊だと思います。個人的には第8章PyIceberg、第12章パフォーマンス最適化を興味深く読むことができました。
素晴らしい本を執筆し、またサンプルを送付してくれた田中さんとべりんぐ氏、技術評論社様に改めて感謝を申し上げます!
