Researchers discover personality subnetworks already embedded in language models' parameters; training-free method isolates opposing personas like introvert-extrovert without external prompting or fine-tuning.

Your Language Model Secretly Contains Personality Subnetworks

View PDF HTML (experimental) Abstract:Humans shift between different personas depending on social context. Large Language Models (LLMs) demonstrate a similar flexibility in adopting different personas and behaviors. Existing approaches, however, typically adapt such behavior through external knowledge such as prompting, retrieval-augmented generation (RAG), or fine-tuning. We ask: do LLMs really need external context or parameters to adapt to different behaviors, or do they already have such kno...