from A Comprehensive Guide to 40 ML Interview Questions.
機械学習の面接では、F1スコアの理解やロジスティック回帰の名前の由来、ニューラルネットワークの活性化関数の役割、ランダムフォレストとロジスティック回帰の違い、がん検出における精度と再現率のバランスの重要性など、基本的な概念が問われます。また、スケワネスがモデルのパフォーマンスに与える影響、アンサンブルメソッドの利点、外れ値の扱い方、バイアスとバリアンスのトレードオフ、サポートベクターマシンの原理とカーネルトリックの理解も重要です。
モデルの最適化には、ラッソとリッジ正則化の違い、セルフスーパーバイズドとセミスーパーバイズドラーニングの区別、ベイズ最適化とグリッドサーチの比較、モデルのアンサンブルとランダムフォレストのメリット、特徴量の選択と特徴抽出の違いが関連します。
モデルの評価と解釈では、アウトオブバッグエラーの意味、バギングとブースティングの違い、モデル解釈のための前方および後方フィル、ROC曲線のAUCの解釈、モデルのバイアスとバリアンスの調整方法がキーとなります。
データの前処理とスケーリングでは、特徴量のスケーリングと正規化の目的の違い、Zスコアの計算、PCAと特徴量選択の関係、クロスバリデーションの役割と利点、グリッドサーチとハイパーパラメータチューニングの重要性が評価されます。
最後に、モデルの最適化と改善には、バイアスが高く分散が低いモデルへの対処、ROC曲線のAUCの解釈、モデルの量子化と剪定の原理、画像セグメンテーションへのアプローチ、GridSearchCVの役割と利点が含まれます。これらのテーマは、機械学習の面接で求められる知識の幅広さと深さを示しています。