Mechanistic Interpretability
  • 🤷‍♂️Introduction to Mechanistic Interpretability (기계적 해석의 전반적인 설명)
  • 🥝요약 번역
    • A Mathematical Framework for Transformer Circuits 이해하기
    • In context learning and Induction heads 이해하기
    • Causal Scrubbing a method for rigorously testing interpretability hypothesis [Redwood Research] 이해하기
  • Post
    • [기계적 해석 기초] 다의성(Polysemanticity)과 Sparse Autoencoder 설명
Powered by GitBook