資格

G検定カンペ兼勤務時間中にこっそり復習用

はてなブックマーク - G検定カンペ兼勤務時間中にこっそり復習用
Pocket
LINEで送る

G検定学習用の個人的なカンペです。

G検定合格者の先人達はカンペ必須との意見が多かったことから私も作成することにしました。

会社の勤務時間中にこっそり復習する様にも使いたいなと思ってます。

バレないように注意ですが(笑)

 

 

スポンサーリンク

 

G検定の勉強をしてみて感じたこと

素人の私の感想としては機械学習とディープラーニングの手法がごちゃごちゃになってきます。

基本構造である

人工知能 > 機械学習 > ディープラーニング

を意識してテキストや問題集の目次を参考に見直した方が覚えやすいかもしれません。

出題傾向が多い順は

  1. ディープラーニング概要>手法>法律>最新技術
  2. 機械学習の手法
  3. 人口知能の動向>問題

となってるようです。

 

G検定で役立つサイト内検索コマンド

G検定は自宅受験なのでGoogle先生も活用可能みたいです。

見つけたいキーワードへ直ぐに飛べる様に以下のサイト内検索コマンドを書いておきます。

 

Mac: Command + F

Windows: Ctrl + F

前の候補に戻りたいときは「Shift + Enter」

 

ディープラーニングの手法

画像データ

一番研究が活発な分野。

赤、緑、青の3つ情報を持ち、縦横奥行の3次元構成。

RGB画像またはカラー画像と呼ばれる。

縦横の位置関係が重要な意味を持つ。

CNNの基本形

視覚野の神経細胞の働きを模したもの。

入力層に近い中間層は全体的な特徴を捉える。

出力層に近い中間層は個別の特徴を捉える。

逆伝播シグナルを用いる。

ネオコグニトロン

1980年代に福島邦彦によって提案された階層的、多層化された人工ニューラルネットワーク。

畳込みニューラルネットワークのさきがけとなった。

人間の視覚を模した。

単純型細胞(S細胞):濃淡パターン(特徴)を検出

複雑型細胞(C細胞):特徴の位置が変わっても同一の特徴とみなす

手書き文字認識、パターン認識に使用。

学習方法:微分(勾配計算)をしないadd-if silent

 

LeNet

1998年ヤン・ルカンによって作られたモデル

単純型細胞(S細胞):濃淡パターン(特徴)を検出

→ 畳み込み層

複雑型細胞(C細胞):特徴の位置が変わっても同一の特徴とみなす

→ プーリング層(サブサンプリング層)

学習方法:誤差逆伝播法

 

 

CNNのデータ拡張

Cutout

少ないデータでも学習することができる。

マスクする領域の大きさは,どのデータセットについても同一である。

画素値を0またはランダムにする。

正方領域をマスクする手法。

 

Random Erasing

Cutoutの類似手法。

少ないデータでも学習することができる。

Cutoutに比べて複雑。

画像中のランダムな位置にランダムな縦横比の長方形を領域をランダムな値でマスクする。

物体検出タスクでは,画像全体をマスクする,物体ごとにマスクする,両方を組み合わせてマスクする,という3パターンの適用方法がオプションとして提案されている。

 

Mixup

2枚の画像を合成して、存在しない画像を類似的に作成

CutMix

CutoutとMixupを組み合わせたもの。

画像を2枚用意し,一つの画像からもう一つの画像へコピーする手法。

 

AugMix

複数の変換をかけた画像を最後に混ぜ合わせる手法。

CNNの発展形

 

MobileNet

Googleによって発表。

※小型端末専用のモデルではない。

ハイパーパラメータ:width multiplier と resolution multiplier を用いる。

 

MobileNetの手法 Depthwise Separable Convolution

畳み込みの計算を分割,計算量の減少を達成。

計算量を1/8程度に削減。

空間方向、チャネル方向に対して独立して畳み込みをする。

 

Depthwise Convolution

Depthwise Separable Convolutionの空間方向の畳み込みのこと

チャネル毎に畳み込み

Point Convolution

Depthwise Separable Convolutionのチャネル方向の畳み込みのこと

1×1の畳み込み

 

Neural ArchitectureSearch(NAS)

リカレントニューラルネットワークと深層強化学習を用いて探索。

ニューラルネットワークの構造自体がパラメータと重みを最適化する。

膨大な計算量が必要な点が改善点とされている。

AutoMLを実現するための理論である。

NASはパラメータ最適化の前段階であるネットワーク構造の最適化も行う。

 

NASNet

CNNの畳み込みやプーリングをCNNセルと定義しCNNセルの最適化を行う。

探索に時間が掛かる。

MnasNet

Googleによって発表。

AutoMLを参考にしたモバイル用のCNNモデル設計。

速度情報を探索アルゴリズムの報酬に組み込むことで,速度の制約に対処した。

探索に時間が掛かる。

EfficientNet

転写学習に有効。

NASNet,MnasNetより速い

 

RNN

 

機械学習の手法

教師=出力データ

 

教師あり学習

正解データを予測できるように正解データ(目的変数)とその他の変数(説明変数=特徴量)のセットの関数を学習する枠組み。

予測すべき値の性質によって、分類と回帰に分かれる。

回帰問題

連続値。気候や年収など。予測。

線形回帰

ラッソ回帰(L1正則化、スパース)、リッジ回帰(L2正則化)

 

ランダムフォレスト

バギング(全体から一部のデータ+複数のモデルで学習=アンサンブル学習)→ 決定木(特徴量をランダムに選ぶ) → ブートストラップサンプリング(学習データもそれぞれの決定木に対してランダムにデータを取り出す) → 結果を多数 

 

バギングは並列処理。低バリアンス化、高バイアス化。

 

ブースティング

バギングと同様一部のデータを繰り返し抽出し、複数モデルを学習させる。

逐次学習。勾配ブースティングが有名。

学習に時間が掛かる。

低バイアス化、高バリアンス化。

 

サポートベクターマシン(SVM)

高度な数学的理論。

異なるクラスの各データ点との距離が最大となるような境界線を求めることでパターン分類を行う。

この距離を最大化することをマージン最大化という。

扱うデータが高次元、線形分類不可の場合はカーネル関数を使う。

計算が複雑にならないように式変形することをカーネルトリックという。

 

ニューラルネットワーク(NN)

単純パーセプトロン 

入力層 → 重み → 出力層

 

多層パーセプトロン

入力層 → 隠れ層 → 出力層

シグモイド関数

活性化関数

誤差逆伝播法:計算量を減らすために使う

 

自己回帰モデル(ARモデル)

時系列データ

時系列分析

ベクトル自己回帰モデル(VARモデル)

 

分類問題

離散値。カテゴリー分け。疾病の有無や性別など。関係性。

 

ロジスティック回帰

シグモイド関数、ソフトマックス関数

 

サポートベクターマシン

ランダムフォレスト → 決定木

 

2値分析 シグモイド関数

ラベルが2分類。

出力値0.5以上なら正例(+1)、出力値0.5未満なら負例(0)

0.5を閾値という。

 

多値分析 ソフトマックス関数

ラベルが3種類以上

マルチクラス分析 → 個々の観測がただ一つのクラスに属する

マルチラベル分析 → 同時に複数のクラスに属し得る

 

教師無し学習

正解を参照せずに変数同士の構造やパターンを抽出する枠組み。

 

階層無しクラスタリング(k-means法/k-平均法)

クラスタ分析

 

階層ありクラスタリング(ウォード法)

k-means法+階層構造

樹形図=デンドログラム(トーナメント表)

 

次元削減

主成分分析

少量の特徴量=主成分

特異値分解(singular value decomposition SVD)
多次元尺度構成法(multi-dimensional scaling MDS)
t-SNE(t-distributed stochastic neighbor embedding)

可視化に用いられる次元圧縮の手法

 

協調フィルタリング

レコメンデーションに用いられる手法

コンテンツベースフィルタリング

 

 

強化学習

正解を与える代わりに、将来の報酬や利益の最大化するように特定の状況下における行動を学習する枠組み。

 

人工知能

 

 

オッカムの剃刀

ある事柄を説明するためには、必要以上に多くを仮定するべきでない。

 

セマンティックセグメンテーションとインスタンスセグメンテーション

セマンティックセグメンテーションにおいては,同一ラベルであっても個が区別されるが,インスタンスセグメンテーションと呼ばれる手法では,同一ラベルでも個が区別されないという特徴がある。

パノプティックセグメンテーション

セマンティックセグメンテーションとインスタンスセグメンテーションを組み合わせたパノプティックセグメンテーションと呼ばれる手法がgoogleチームより発表された。

 

パルス符号変調

標本化:アナログ信号を一定時間ごとに区切り、その値を読み込むこと(サンプリングとも呼ぶ)

量子化:標本化し読み込んだ値をデジタル信号に変換できるように加工すること

符号化:量子化された値を指定された二進コードなどで符号化すること

 

スパースモデリング

あらゆるものごとに含まれる本質的な情報はごくわずかである(=スパース性)という仮定に基づき、データそのものではなく同士の関係性に注目することで、少量のデータでも分析可能とする技術。

Lassoなど。

 

AI原則・ガイドライン

基本理念

  1. 人間の尊厳が尊重される社会
  2. 多様な背景を持つ人々が多様な幸せを追求できる社会
  3. 持続性ある社会

ビジョン

  1. 社会システム
  2. 産業構造
  3. イノベーションシステム
  4. ガバナンス

AI社会原則

  1. 人間中心の原則
  2. 教育・リテラシーの原則
  3. プライバシー確保の原則
  4. セキュリティ確保の原則
  5. 公正競争確保の原則
  6. 公平性、説明責任及び透明性の原則
  7. イノベーションの原則

 

 

 

-資格
-