"状態の水行為"の翻訳 英語に:
辞書 日本-英語
状態の水行為 - 翻訳 :
例 (レビューされていない外部ソース)
それは状態sで行為を実行した時に状態s'へと | How does the world evolve as we take actions in the world? |
言い換えるとマルコフ決定過程の 状態と行為と状態遷移行列は | leads to state S3. |
sは状態の要素です 行為の集合は | An MDP consists of a set of states |
脱水状態だ | Dehydrated. |
全部で8つの状態があり 状態間をつなぐ行為があります | Here is a diagram of the state space for the vacuum world. |
ステップコスト関数は状態 行為 結果としての新しい状態を入力すると | And so we'll implement this Path Cost function, in terms of a Step Cost function. |
これを状態と行為の組に適用します | Then the alpha, the learning rate, is 1 2. That gives us 45. |
吸収状態でないすべての状態に行為を割り当てた ポリシーを与え | And suppose for now, every other state costs you 3. |
状態sで実行可能な行為aはPoss a s で | So wherever you see a variable without a quantifier, assume that there's a For All. |
ポリシーは各状態に行為を割り当てます | So we wish to have a planning method that provides an answer no matter where we are and that's called a policy. |
c4の状態でどの行為も選べるとして 最適な行為は何ですか | Narrator The next question is challenging. |
どんな行為がゴール状態を導くのか考えます | And now we can start searching backwards. |
状態ではなくパスに対応します パスは状態空間探索で得られる行為のパスです 仮に2つの異なる行為の集合が 1つの世界状態に導かれても | Then we have situations, and situations are also objects in the logic, and they correspond not to states but rather to paths the paths of actions that we have in state space search. |
エージェントがその状態で実行できる 行為一式を割り出します ある問題ではエージェントは すべての状態に同じ行為で対応し | Next, a function Actions that takes a state as input and returns a set of possible actions that the agent can execute when the agent is in this state. |
この状態にいると北へ向かう行為を実行するので | We apply that 45 to the state action pair. |
状態を行為の組で定義することもできます | We seek to maximize a reward function that we define over states. |
これは状態 行為 プランを扱う表現言語であり | Norvig |
次は状態を入力として受け取る 行為 の関数で | In our route finding problem, the initial state was the agent being in the city of Arad. |
報酬関数Rが必要です 時には状態sから行為aを使って状態s'へと | And then, in addition to the transition, we need a reward function which we'll denote R. |
状態の集合や対応する行為は完全観測可能です | We've learned about Markov Decision Processes. |
すべての行為と状態が対象の場合 状態sにおいて行為aが実行可能ならば 一般的にどのようになるか続きを書きます フルーエントは行為aによってのみ真になり | And in general, a successor state axiom will have the form of saying for all actions and states, if it's possible to execute action A in state S, then and I'll show in general what they look like here the fluent is true if and only if action A made it true or action A didn't undo it. |
可能な行為の1つは 貨物 で 貨物C₁を飛行機P₁に積み空港SFOへ行き その行為がまた次の新しい状態を生成します それはまた別の状態変数セットで | And then we start branching on the possible actions, so say one possible action would be to load the cargo, C1, onto the plane, P1, at SFO, and then that would bring us to another state which would have a different set of state variables set, and we'd continue branching out like that until we hit a state which satisfied the goal predicate. |
また別の問題では状態により 違った行為を実行します ルート検索の問題では 状態によって行動が異なります | In some problems, the agent will have the same actions available in all states and in other problems, he'll have different actions dependent on the state. |
Actions関数によって その状態で可能な行為が与えられます | We have a set of players P that can be our one player, as in this game, or two or more. |
単一の行為と状態を見つけます これは一般的なプランニングです | But you'll find a single sequence of actions and states that might cut the corners, as close as possible, to reach the plus 100 as fast as possible. |
その状態に基づいて行為が実行され そのたびにQ値が更新されます すべての行為と状態の組を満たす値が得られるまで このプロセスを繰り返し行います | In each case, we'd be updating only the action we took, associated with that state, not the whole state. |
要素をaとするとそれぞれの状態sで 実行可能な行為の集合です | S is an element of the state, S a set of actions |
それらの確率論的な行為の影響は 状態Sで行為Aを取った状態S の 条件付きの確率によって特徴づけられています 状態に対して定義される報酬関数を最大化します | We have fully observable with a set of states and corresponding actions where they have stochastic action effects characterized by a conditional probability entity of P of S prime given that we apply action A in state S. |
状態 ロードして実行中 | Status Loaded and running. |
元の信念状態と行為から次の状態を予測した結果を 観測Oによって更新したものです 予測ステップではある信念状態から始めて | And what we say is our new belief state is the result of updating what we get from predicting what our action will do and then updating it, based on our observation, O, of the world. |
この状態には北 次は北 東 東 東と 割り当てます この状態には北 この状態には西 これには東を割り当てます 吸収状態を除く各状態に対し 行為を1つ定めることでポリシーを決めます | So for example a policy might look as follows for this state, we wish to go north, north, east, east, east, but for this state over here, we wish to go north, maybe east over here, and maybe west over here. |
そして行為a₁ a₂があるとします このような状態遷移図となります これは有限状態機械です | Suppose you have states S1, S2, and S3, and you have actions A1 and A2. |
述語を表すAction s も使われません 状況計算ではなぜか状況に適した行為の記述はせず 代わりにその状態で可能な行為が使われ | And now instead of describing the actions that are applicable in a situation with a predicate Actions of S, situation calculus for some reason decided not to do that and instead we're going to talk about the actions that are possible in the state, and we're going to do that with a predicate. |
この状態とこの状態です | Now let's expand it more, and there's now two options finally |
任意の状況sと行為aに対して もし状況sで行為aが可能ならば | So here's one example of a successor state axiom. |
石油とはシチュー状態の炭化水素分子です | Let me tell you a little bit about this chemistry of oil. |
それを忠実に守るわけです そしてこの行為が失敗した時のみ 他の状態を探索するのです この状態から上に行くのは | So if the policy here was to go up and then go right, then we would always stick to that and the only time we would explore any other state is when those actions failed. |
つまり信念状態の大きさは 遷移前と同じであるか減少するのです もし2つの行為が偶然に同じ状態へ遷移すれば 状態は減少します 一方で観測は行為とは異なる効果を発揮します | That's what we mean by deterministic, and so that means the size of the belief state will either stay the same or it might decrease if 2 of the actions sort of accidentally end up bringing you to the same place. |
お前の進行状態を教えろ | Just tell me how your team is progressing. |
2種類のイベントによって どのように信念状態が展開していくか説明します この状態から行為を開始します | So here's a partial diagram of the part of the belief state from that world, and I want it to show how the belief state unfolds as 2 things happen. |
活性化状態になり そして低い状態に移り それがヨウ化水素です | Surpass the kinetic so they have enough kinetic energy to get into the activation state, and then they can go to the |
行為の実行を継承します 一般的に後続状態公理は次のように記述します | These are used to describe what happens in the state that's a successor of executing an action. |
状態空間と言われ 行為を加えることで進むことができます 行為はそれぞれの町で異なります | Now the set of all of the states here is known as the state space, and we navigate the state space by applying actions. |
固体の状態になった水は氷と呼ばれる | Water in a solid state is called ice. |
行為の影響が確率論的だからです 決定的なプランニングにおけるケースで 一連の状態と行為を作るというよりも | It's really different from planning than before because of the stochasticity of the action effects. |
関連検索 : 行為の状態 - 水の状態 - 水の状態 - 水行為 - 水和状態 - 水分状態 - 浸水状態 - 水辺の状態 - 発行の状態 - 飛行の状態 - 状態の施行 - 走行状態 - 行動状態 - 実行状態