"ポリシーの学習プラットフォーム"の翻訳 英語に:
辞書 日本-英語
ポリシーの学習プラットフォーム - 翻訳 :
例 (レビューされていない外部ソース)
これでエージェントが学習したポリシーと 最適ポリシーの差が分かります | I've also graphed, with a dotted line, the policy loss. |
最適ポリシーを学習していれば ポリシーの損失は下がってゼロになります | What does that mean? so that's the difference between the policy that the agent has learned and the optimal policy. |
そして40回辺りで 何か重要なことを学習しました そこで得た最終ポリシーを学習したのです | It was high, up here, and then at around step 40, it learned something important. |
よさそうなポリシーにとらわれて 他の学習を行わないからです | Because it was Greedy, it found something that seemed to be doing good for it, and then it never deviated from that. |
受動学習が同じポリシーに 忠実であるという事実から問題は生じます ここにΠ s のポリシーがあり | And they all stem from the same cause, from the fact that passive learning stubbornly sticks to the same policy throughout. |
これを用いて学習を続けます 最初に得たポリシーが無効なら | Now we have a new policy, and we continue learning with that new policy. |
しかし船長のポリシーは変えられません それが受動的学習です もう一方は能動的強化学習といいます | You learn, and remember what you've learned, but that doesn't change the captain's policy and that's passive learning. |
学習 | Learning |
学習 | Learn |
それを知らなくても固定されたポリシーを 実行している間に学習します | But it learns about the reward function, R, and maybe the transition function, P, if it didn't already know that. |
アルファベットの学習Comment | Learn The Alphabet |
評価や解決方法の理解は深めました 固定されたポリシーを示すπの効用を学習し | If we don't know what the MDP is, we know how to estimate it and then solve it. |
プラットフォーム | Platform |
学習です 次の | So, that's it for Unsupervised |
アリの学習センターか | A center for ants? |
学習アルゴリズムを見てきた 教師有り学習の中では それぞれの学習アルゴリズム同士のパフォーマンスは | By now, you see the range of different learning algorithms. |
君は学習したから 船のポリシーの変更を認めよう 次に向かう場所を決定してよろしい | Okay I'm going to hand over control and as you learn, I'm going to allow you to change the policy for this ship. |
デフォルトのポリシー | Default Policy |
オフラインキャッシュのポリシー | Offline Cache Policy |
地理学学習プログラムComment | A Geography Learning Program |
既に見た 学習アルゴリズムおよび 今後の授業で学ぶ学習アルゴリズムを | Octave, in which you'll be able to very quickly implement the the learning algorithms we've seen already, and the learning algorithms we'll see later in this course. |
ポリシー | Policies |
ポリシー | Policy |
つまり元の位置の方向に戻ります この受動的に固定されたポリシーに従った 強化学習エージェントが | And if we did end up here, then we'd immediately head back towards the road, so we'd aim back down in this direction. |
プラットフォームComment | Platform |
プラットフォームP. | Platform B. |
プラットフォームだ! | They're on the platform! |
南米の学習者は | Students may display captions in their native language. |
学校の補習だよ | Hey, hey, hey. What happened to you? |
学習する事も出来るし 聞き取りも学習出来るし 感触の処理も学習出来る 数学を | The brain can learn to see process images than to hear, learn to process our sense of touch. |
機械学習の分野の | One final note |
この学習の過程で | Whatever you put in front of them, they'll take statistics on. |
このポリシーが | but the insurance company aren't silly people. They're very ughh scrutinize probabilities. |
地理学習プログラム | A geography learning program |
学習が速い | I mean they have much larger vocabulary. |
学習成果ゼロ | Did not learn anything. |
ハーバード大学で 英語学の学位を習得し | I don't look like a typical domestic violence survivor. |
少し外のプラットフォーム | Th' carriage is waitin' outside for thee. A brougham stood on the road before the |
学習者は学習しながら価値を生んでいるので | So this is how we could monetize this. |
テストセットに送る前に ここに 学習アルゴリズムと回帰の学習の訓練を | Before you know sending the first 70 in the training set and the last 30 of the test set. |
学習者は数学との関わりや | Basically, no one's very happy. |
汎用カード ベースの学習プログラム | Generic card based learning program |
Java ポリシー | Java policy |
JavaScript ポリシー | JavaScript policy |
それを学習アルゴリズムに読み込ませます 学習アルゴリズムの仕事は | We saw that with the training set like our training set of housing prices and we feed that to our learning algorithm. |
関連検索 : 学習プラットフォーム - オンライン学習プラットフォーム - ポリシーの練習 - プラットフォームの化学 - 化学プラットフォーム - 学習の - 学習 - 学習 - 学習 - 入学ポリシー - ポリシー文学 - 学習習慣 - 習得学習 - 学習習慣