CSDNの最近の技術分析は、中国のデータベースオプティマイザにおける重要な分岐点を浮き彫りにしています。それはDISTINCTの処理方法です。著者は、一部のオプティマイザは実行計画を決定するためにコストモデルに依存する一方、他のオプティマイザは最適な経路を導出するために形式証明技術を使用すると主張しています。この違いはベンチマーク比較では隠れがちですが、DISTINCTではソート、ハッシュ、または早期集約の選択を強制するため、顕在化します。この投稿は、OceanBaseやTiDBなどの中国のオープンソースデータベースにおける特定の動作を、直接名指しはせずに参照しています。クエリエンジンを構築またはチューニングするエンジニアにとって、これは中国のデータベースシステムが単に西洋の設計をコピーするのではなく、独自の最適化哲学を発展させていることを示しています。実用的な意味合いとしては、中国のデータベースでのDISTINCTを多用するワークロードのパフォーマンスが予測不能になる可能性があり、専門的なチューニング知識が必要になることです。
中国のデータベースオプティマイザがDISTINCTを処理する方法の分析により、コストベースと証明ベースの戦略の分裂が明らかになりました。