"ポリシーに従います"の翻訳 英語に:
辞書 日本-英語
ポリシーに従います - 翻訳 :
例 (レビューされていない外部ソース)
1 獲得済みの最適ポリシーに従います | So let's really think about what we're doing when we're executing the active TD learning algorithm. |
ポリシーの指示に従うからです 偶然こちらの状態に外れても ポリシーに従って何もしません | If we tried to go up from this state because that's what the policy said but, stochastically, we slipped over to this state then we wouldn't do something else, according to the policy and so we'd get a little bit of exploration, but we'd only vary from the chosen path because of that variation and we wouldn't intentionally explore enough of the space. |
すでに獲得した最良のポリシーに一定時間従い | Now, one possibility is, certainly, random exploration. |
従って点線で表したポリシーの損失は | And it's converging to much better results. |
移動に伴って経験が更新され 新しいポリシーが得られます 2 状態の効用に従います | First, we're keeping track of the optimal policy we've found so far and that gets updated as we go, and replaced with new policies. |
エージェントは 1 2 の状態のポリシー 下に動く に従って移動し | And we can see for example, this looks like a mistake here. |
ポリシーはこのようになります | I'm closing up the wall over here, opening the wall down here, run it. |
最適ポリシーを学習していれば ポリシーの損失は下がってゼロになります | What does that mean? so that's the difference between the policy that the agent has learned and the optimal policy. |
ポリシーに合致しません | A policy was not met. |
ポリシー | Policies |
ポリシー | Policy |
探索エージェントは 不確実な世界の探索に積極的で 世界が確実になるに従って 最適ポリシーもしくはそれに準ずるポリシーの 探索に戻っていきます | Now what that suggests is the design for an exploration agent that will be more proactive about exploring the world when it's uncertain, and will fall back to exploiting the optimal policy or whatever policy it has as close to optimal when it becomes more certain about the world. |
それは 私どものポリシーに反します | That's not our policy, sir. |
ポリシーを適用します するとポリシーが 動く方向を教えてくれます ここで報酬を手にします | So we'll start at a start state, we'll apply the policy and let's say the policy tells us to move in this direction. |
期間 20 年のポリシーを持っています | I have mortgage and I have young child and I want to make sure that if anything were to happen to me over the next... |
これでエージェントが学習したポリシーと 最適ポリシーの差が分かります | I've also graphed, with a dotted line, the policy loss. |
Java ポリシー | Java policy |
JavaScript ポリシー | JavaScript policy |
新しい Java ポリシー | New Java Policy |
新しい JavaScript ポリシー | New JavaScript Policy |
つまり元の位置の方向に戻ります この受動的に固定されたポリシーに従った 強化学習エージェントが | And if we did end up here, then we'd immediately head back towards the road, so we'd aim back down in this direction. |
ラベルはよくポリシーと呼ばれます | As you can see, each grid cell now has a label. |
彼に従います | I'll serve his purpose. |
ポリシーは各状態に行為を割り当てます | So we wish to have a planning method that provides an answer no matter where we are and that's called a policy. |
標準ポリシー | Default Policy |
重複ポリシー | Duplicate Policy |
デフォルトのポリシー | Default Policy |
送信ポリシー | Send policy |
オフラインキャッシュのポリシー | Offline Cache Policy |
実際に得られるポリシーが機能し 時間をかけて収束します よりよいポリシーを得るためには | So that policy does, in fact, work randomly making moves with some probability but it tends to be slow to converge. |
全体設定のポリシーを使用します | Use setting from global policy. |
最適なポリシーと行動があります | Realize that even states I'm not likely to every reach, |
命令に従います | The immortal leader of our race. To the order for which he stands. |
注目すべきはポリシーです | They happen to be 1000 for the two obstacles. |
最適なポリシーを見つける手段になります | This is the way of backing up values, and once values have been backed up, this is the way to find the optimal thing to do. |
ドメイン固有ポリシー | Domain Specific Policies |
不正なポリシー | Bad policy |
このポリシーが | but the insurance company aren't silly people. They're very ughh scrutinize probabilities. |
誓います 貴方に 従います | I pledge myself... to your teachings. |
ポリシーの表の をチェックすることで分かります ポリシーの表には R Lがありますが その他は前回と同様です | While I haven't reached the goal state quite yet as indicated by checking for the star in my policy table. |
Π S というポリシーを見つけてみましょう それが答えです 最適ポリシーであるΠは | Now to solve an MDP, we're trying to find a policy pi of S that's going to be our answer. |
受動学習が同じポリシーに 忠実であるという事実から問題は生じます ここにΠ s のポリシーがあり | And they all stem from the same cause, from the fact that passive learning stubbornly sticks to the same policy throughout. |
これが対応するポリシーです | After conversions for this grid, I want the value function to look just like this. |
ご忠告に従います | I'll act on your advice. |
ご忠告に従います | I will follow your advice. |
関連検索 : に従います - に従います - トレンドに従います - ルールに従います - スーツに従います - プロセスに従います - スケジュールに従います - ルールに従います - プロトコルに従います - ガイダンスに従います - ルールに従います - プラクティスに従います - スケジュールに従います - プロセスに従います