Transaction Details

Transaction Hash: 0xa72a1802fe5c2f4cabe206544285a2cdb12d05e975a61f7a03b16a65d3d40e74
Block: 2324366
Timestamp: Mar 18, 2026, 12:57:29 PM
From: 0x4287F10566e073e3B823c9Ad5f15b535058D5c8e
Nonce: 18
Operation Type: SET_VALUE

Operation

{
  "type": "SET_VALUE",
  "ref": "/apps/knowledge/topics/courses/direct-preference-optimization-your-language-model--dpo-direct-preference-optimization/.info",
  "value": {
    "title": "Direct Preference Optimization: Your Language Model is Secretly a Reward Model —",
    "description": "DPO introduces a simple classification loss that directly optimizes language model policies on human preference data, eliminating the need for reinforcement learning while maintaining theoretical equivalence to the RLHF objective.",
    "created_at": 1773838649227,
    "created_by": "0x4287F10566e073e3B823c9Ad5f15b535058D5c8e"
  }
}