Метод самосогласованного поля

28.10.2021

Теория среднего поля или теория самосогласованного поля — подход к изучению поведения больших и сложных стохастических систем в физике и теории вероятностей через исследование простых моделей. Такие модели рассматривают многочисленные малые компоненты, которые взаимодействуют между собой. Влияние других индивидуальных компонент на заданный объект аппроксимируется усреднённым эффектом, благодаря чему задача многих тел сводится к одночастичной задаче.

Идея впервые сложилась в физике в работах Пьера Кюри и Пьера Вейсса, что описывали фазовый переход. Аналогичные подходы нашли применение в моделях эпидемий, теории очередей, в анализе компьютерных сетей и теории игр.

Задачу многих тел с учётом взаимодействия между ними решить трудно, кроме самых простых случаев (теория случайных полей, одномерная модель Изинга). Поэтому систему N тел заменяют одночастичной задачей с хорошо подобранным внешним потенциалом, который заменяет действие всех других частиц на выбранное. Большую сложность имеет (например, при вычислении функции распределения в статистической механике) учёт перестановок при вычислении взаимодействия в гамильтониане при суммировании по всем состояниям. Цель теории среднего поля обойти комбинаторный подход. В различных областях науки теория среднего поля известна под своими собственными названиями, среди которых приближения Брэгга — Вильямса, модель решётки Бете, теория Ландау, приближение Пьера Вейсса, теория растворов Флори — Гаггинза или теория Схейтьенса — Флера.

Основная идея теории среднего поля — заменить все действия на выбранное тело усреднённым или эффективным взаимодействием, которое иногда называют молекулярным полем. Это сводит любую задачу многих тел к эффективной одночастичной задаче. Лёгкость решения задачи теории среднего поля означает получение определённого знания о поведении системы со сравнительно небольшими затратами.

В классической теории поля, функцию Гамильтона можно разложить в ряд, используя в качестве параметра разложения величину флуктуаций вблизи среднего поля. Среднее поле можно тогда рассматривать как нулевой порядок этого разложения. Это означает, что теория среднего поля не содержит никаких флуктуаций, но это соответствует тому, что взаимодействия заменяются на среднее поле. Довольно часто при изучении флуктуаций теория среднего поля является стартовой площадкой для исследования флуктуаций первого или второго порядка.

В общем определение того, насколько приближение среднего поля будет работать для конкретной задачи сильно зависит от размерности. В теории среднего поля многочисленные взаимодействия заменяются одним эффективным действием. Тогда, естественно, если поле или частица в начальной системе имеет много партнёров взаимодействия, то теория среднего поля будет эффективной. Это справедливо для высоких размерностей, там где функция Гамильтона включает в себя силы с большим радиусом действия или когда частицы протяжённые (например, полимеры). Критерий Гинзбурга является формальным выражением того, как флуктуации делают приближение среднего поля плохим, часто в зависимости от пространственной размерности системы.

Тогда как теория среднего поля сложилась в статистической механике, она нашла применение и в других областях, например, интерференции, теории графов, нейронауке и при изучении искусственного интеллекта.

Формальный подход

В основе формального подхода к теории среднего поля лежит неравенство Боголюбова. Она утверждает, что свободная энергия системы с функцией Гамильтона

H = H 0 + Δ H {displaystyle {mathcal {H}}={mathcal {H}}_{0}+Delta {mathcal {H}}}

имеет верхнюю границу

F ≤ F 0   = d e f   ⟨ H ⟩ 0 − T S 0 {displaystyle Fleq F_{0} {stackrel {mathrm {def} }{=}} langle {mathcal {H}} angle _{0}-TS_{0}}

где S 0 {displaystyle S_{0}} — энтропия, а усреднение проводится по равновесному ансамблю системы с функцией Гамильтона H 0 {displaystyle {mathcal {H}}_{0}} . В специальном случае, когда основная функция Гамильтона описывает систему без взаимодействия, а потому её можно записать как

H 0 = ∑ i = 1 N h i ( ξ i ) {displaystyle {mathcal {H}}_{0}=sum _{i=1}^{N}h_{i}left(xi _{i} ight)}

где ( ξ i ) {displaystyle left(xi _{i} ight)} — сокращение для обозначения степени свободы отдельных составляющих статистической системы (атомов, спинов и т. д.), можно рассматривать уточнения верхнего предела минимизируя правостороннюю часть неравенства. Минимизация основной системы является тогда лучшим приближением к заданной. Она известна как приближения среднего поля .

Чаще всего функция Гамильтона системы, которую нужно исследовать, содержит только парные взаимодействия, то есть

H = ∑ ( i , j ) ∈ P V i , j ( ξ i , ξ j ) {displaystyle {mathcal {H}}=sum _{(i,j)in {mathcal {P}}}V_{i,j}left(xi _{i},xi _{j} ight)}

где P {displaystyle {mathcal {P}}} — набор парных взаимодействий. Тогда процедуру минимизации можно провести формально. Определяется T r i f ( ξ i ) {displaystyle { m {Tr}}_{i}f(xi _{i})} как обобщенная сумма наблюдаемых f {displaystyle f} по степеням свободы одной компоненты (сумма для дискретных величин, интергал для непрерывных). Свободная энергия задается приближенно как

где P 0 ( N ) ( ξ 1 , ξ 2 , . . . , ξ N ) {displaystyle P_{0}^{(N)}(xi _{1},xi _{2},...,xi _{N})} — вероятность найти основную систему в состоянии с переменными ( ξ 1 , ξ 2 , . . . , ξ N ) {displaystyle (xi _{1},xi _{2},...,xi _{N})} . Эта вероятность задается нормализованным больцмановским фактором

P 0 ( N ) ( ξ 1 , ξ 2 , . . . , ξ N ) = 1 Z 0 ( N ) e − β H 0 ( ξ 1 , ξ 2 , . . . , ξ N ) = ∏ i = 1 N 1 Z 0 e − β h i ( ξ i )   = d e f   ∏ i = 1 N P 0 ( i ) ( ξ i ) {displaystyle {egin{aligned}P_{0}^{(N)}(xi _{1},xi _{2},...,xi _{N})&{}={frac {1}{Z_{0}^{(N)}}}e^{-eta {mathcal {H}}_{0}(xi _{1},xi _{2},...,xi _{N})}&{}=prod _{i=1}^{N}{frac {1}{Z_{0}}}e^{-eta h_{i}left(xi _{i} ight)} {stackrel {mathrm {def} }{=}} prod _{i=1}^{N}P_{0}^{(i)}(xi _{i})end{aligned}}}

где Z 0 {displaystyle Z_{0}} — статистическая сумма. тогда

F 0 = ∑ ( i , j ) ∈ P T r i , j V i , j ( ξ i , ξ j ) P 0 ( i ) ( ξ i ) P 0 ( j ) ( ξ j ) + k T ∑ i = 1 N T r i P 0 ( i ) ( ξ i ) log ⁡ P 0 ( i ) ( ξ i ) . {displaystyle {egin{aligned}F_{0}=&{}sum _{(i,j)in {mathcal {P}}}{ m {Tr}}_{i,j}V_{i,j}left(xi _{i},xi _{j} ight)P_{0}^{(i)}(xi _{i})P_{0}^{(j)}(xi _{j})&{}+kTsum _{i=1}^{N}{ m {Tr}}_{i}P_{0}^{(i)}(xi _{i})log P_{0}^{(i)}(xi _{i}).end{aligned}}}

Для минимизации берется производная по вероятности одной степени свободы P 0 ( i ) {displaystyle P_{0}^{(i)}} , Используя неопределенные множители Лагранжа для нормирования. Конечный результат — система самосогласованных уравнений

P 0 ( i ) ( ξ i ) = 1 Z 0 e − β h i M F ( ξ i ) i = 1 , 2 , . . , N {displaystyle P_{0}^{(i)}(xi _{i})={frac {1}{Z_{0}}}e^{-eta h_{i}^{MF}(xi _{i})}qquad i=1,2,..,N}

где среднее поле задается как

h i M F ( ξ i ) = ∑ { j | ( i , j ) ∈ P } T r j V i , j ( ξ i , ξ j ) P 0 ( j ) ( ξ j ) . {displaystyle h_{i}^{MF}(xi _{i})=sum _{{j|(i,j)in {mathcal {P}}}}{ m {Tr}}_{j}V_{i,j}left(xi _{i},xi _{j} ight)P_{0}^{(j)}(xi _{j}).}


Применение

Теорию среднего поля можно применять для ряда физических систем, изучая, например, фазовые переходы.

Модель Изинга

Пусть модель Изинга определена на d-мерной решетке. Гамильтониан задается как

H = − J ∑ ⟨ i , j ⟩ s i s j − h ∑ i s i {displaystyle H=-Jsum _{langle i,j angle }s_{i}s_{j}-hsum _{i}s_{i}} ,

где ∑ ⟨ i , j ⟩ {displaystyle sum _{langle i,j angle }} обозначает сумму по парам ближайших соседей ⟨ i , j ⟩ {displaystyle langle i,j angle } , s i = ± 1 {displaystyle s_{i}=pm 1} а s j {displaystyle s_{j}} суть спины ближайших соседей.

Вводя флуктуационные отклонения от среднего значения m i ≡ ⟨ s i ⟩ {displaystyle m_{i}equiv langle s_{i} angle } , гамильтониан можно переписать

H = − J ∑ ⟨ i , j ⟩ ( m i + δ s i ) ( m j + δ s j ) − h ∑ i s i {displaystyle H=-Jsum _{langle i,j angle }(m_{i}+delta s_{i})(m_{j}+delta s_{j})-hsum _{i}s_{i}}

где флуктуации спина обозначено δ s i ≡ s i − m i {displaystyle delta s_{i}equiv s_{i}-m_{i}} .

Раскладывая правую часть, можно получить член, который зависит только от среднего значения спина и не зависит от спиновой конфигурации. Этот член тривиальный, он не влияет на статистические свойства системы. Следующий член содержит произведение среднего значения спина и флуктуации. Наконец, последний член содержит произведения флуктуаций.

Приближение среднего поля заключается в пренебрежении этим членом второго порядка по флуктуациям. Эти флуктуации растут в системах малой размерности, поэтому теория среднего поля работает лучше для систем высокой размерности.

H ≈ H M F ≡ − J ∑ ⟨ i , j ⟩ ( m i m j + m i δ s j + m j δ s i ) − h ∑ i s i {displaystyle Happrox H^{MF}equiv -Jsum _{langle i,j angle }(m_{i}m_{j}+m_{i}delta s_{j}+m_{j}delta s_{i})-hsum _{i}s_{i}}


Слагаемые можно ещё раз перегруппировать. Кроме того, среднее значение каждого из спинов не должно зависеть от узла, поскольку система Изинга трансляционные инвариатна. Поэтому

H M F = − J ∑ ⟨ i , j ⟩ ( m 2 + 2 m ( s i − m ) ) − h ∑ i s i . {displaystyle H^{MF}=-Jsum _{langle i,j angle }left(m^{2}+2m(s_{i}-m) ight)-hsum _{i}s_{i}.}

Суммирование по соседям можно переписать ∑ ⟨ i , j ⟩ = 1 2 ∑ i ∑ j ∈ n n ( i ) {displaystyle sum _{langle i,j angle }={frac {1}{2}}sum _{i}sum _{jin nn(i)}} , где n n ( i ) {displaystyle nn(i)} — ближайшие соседи i {displaystyle i} , а множитель 1/2 предотвращает учет одного и того же слагаемого дважды, поскольку в образовании каждого связи участвуют два спина. Упрощение дает конечный результат

H M F = J m 2 N z 2 − ( h + m J z ) ⏟ h e f f ∑ i s i {displaystyle H^{MF}={frac {Jm^{2}Nz}{2}}-underbrace {(h+mJz)} _{h^{mathrm {eff} }}sum _{i}s_{i}}

где z {displaystyle z} — координационное число. На это время, гамильтониан Изинга разбит на сумму одночастинкових гамильтониана с эффективным средним полем h e f f = h + J z m {displaystyle h^{mathrm {eff} }=h+Jzm} , и среднего поля, которое возникает благодаря соседним спинам. Стоит заметить, что это среднее поле напрямую зависит от числа ближайших соседей, а потому от размерности системы (например, для гиперкубичной решетки размерности d {displaystyle d} , z = 2 d {displaystyle z=2d} ).

Этот гамильтониан подставляют в функцию распределения, и решают эффективную одномерную задачу, получая

Z = e − β J m 2 N z / 2 [ 2 cosh ⁡ ( h + m J z k B T ) ] N {displaystyle Z=e^{-eta Jm^{2}Nz/2}left[2cosh left({frac {h+mJz}{k_{B}T}} ight) ight]^{N}}

где N {displaystyle N} — число узлов решетки. Это замкнутое и точное выражение для функции распределения системы. Из него можно получить свободную энергию и узнать критические индексы. В частности, можно получить намагниченность m в зависимости от h e f f {displaystyle h^{mathrm {eff} }} .

Так получено два уравнения, задающие соотношение между m {displaystyle m} та h e f f {displaystyle h^{mathrm {eff} }} , что позволяет определить m в зависимости от температуры. Следствием этого является следующее:

  • для температур, превышающих определённого значения T c {displaystyle T_{c}} , единственным решением является m = 0 {displaystyle m=0} . Система является парамагнетиком.
  • для T < T c {displaystyle T<T_{c}} существует два ненулевых решения: m = ± m 0 {displaystyle m=pm m_{0}} . Система является ферромагнетиком.

T c {displaystyle T_{c}} находится из соотношения: T c = J z k B {displaystyle T_{c}={frac {Jz}{k_{B}}}} . Этим показано, что теория среднего поля может описать фазовый переход в ферромагнитное состояние.

Применение к другим системам

Аналогично, теорию среднего поля можно применять к другим гамильтонианам:

  • При изучении фазового перехода металл-сверхпроводник. В этом случае, аналогом намагничивания является сверхпроводящая щель Δ {displaystyle Delta } .
  • Для молекулярного поля жидкого кристалла, которое возникает, когда лапласиан поля директора не равный нулю.
  • Для определения оптимальной упаковки боковых цепочек аминокислот для заданной третичной структуры при прогнозе строения белков.

Обобщение для зависимых от времени средних полей

В теории среднего поля, оно возникает для отдельного узла как скалярное или векторное, но не зависит от времени. Однако, это необязательно: в варианте теории, который называют динамической теории среднего поля, среднее поле зависит от времени. Например, динамическую теорию можно применить к модели Хаббарда, изучая переход металл — диэлектрик Мотта .