Transaction Details

Transaction Hash: 0x6cf61b6795d2cee48d3ca4c7ce5ca8db33ed6c1e8e3e5bb954787515020a8953
Block: 5276461
Timestamp: Apr 22, 2026, 11:29:07 AM
From: 0xa8b8a20BeD2Eb34c2c64F51645410887e51Ac425
Nonce: 0
Operation Type: SET_VALUE

Operation

{
  "type": "SET_VALUE",
  "ref": "/apps/knowledge/topics/courses/direct-preference-optimization-your-language-model--dpo-direct-preference-optimization/.info",
  "value": {
    "title": "Direct Preference Optimization: Your Language Model is Secretly a Reward Model —",
    "description": "DPO introduces a simple classification loss that directly optimizes language model policies on human preference data, eliminating the need for reinforcement learning while maintaining theoretical equivalence to the RLHF objective.",
    "created_at": 1776857347182,
    "created_by": "0xa8b8a20BeD2Eb34c2c64F51645410887e51Ac425"
  }
}