Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
ІІ. Лекційний курс
Розділ 4. Магнетизм
§4.1. Магнітне поле і його характеристики. Дія магнітного поля на контур зі струмом. Принцип суперпозиції. Класифікація магнетиків
Більше як 2000 років назад була відкрита властивість магнітної стрілки встановлюватись вздовж земного меридіана. Кінець стрілки, повернутий на північ, дістав назву північного магнітного полюса, а протилежний південного. Було також відкрито взаємодію полюсів притягання різнойменних та відштовхування однойменних. В 1820 році Ерстед відкрив явище відхилення магнітної стрілки електричним струмом, а Ампер взаємодію паралельних струмів; він першим зрозумів, що магнетизм провідників зі струмом і магнетизм постійних магнітів мають однакову природу. Ампер висунув гіпотезу про існування молекулярних мікрострумів (за сучасними уявленнями обумовлених рухом електронів в атомах речовини). Саме мікроструми створюють магнітні поля постійних магнітів. Отже, магнітне поле це особливий вид матерії, що створюється рухомими електричними зарядами (струмами) і діє на рухомі заряди, провідники зі струмом та постійні магніти.
Вивчають магнітне поле за його дією на контур зі струмом (пробний контур). Він може мати довільну форму, але за розмірами має бути достатньо малим, щоб поле в області контура можна було вважати однорідним. Пробний контур характеризується магнітним моментом
, (4.1)
де І сила струму в контурі, S його площа, - одиничний вектор позитивної нормалі до площини контура, напрямок якого визначається за правилом правого гвинта (свердлика): якщо обертати ручку свердлика за напрямком струму в контурі, то напрямок поступального руху його вістря вкаже напрямок позитивної нормалі. Досліди показують, що магнітне поле повертає вміщений в нього контур зі струмом, встановлюючи його в певному рівноважному положенні. При відхиленні контура на 90 від рівноважного положення момент сили, що діє на нього, буде максимальним.
Відношення максимального моменту сили до магнітного моменту контура не залежить від його форми, а характеризує магнітне поле в даному місці простору. Ця характеристика називається магнітною індукцією
. (4.2)
За напрямок приймається напрямок магнітного моменту контура в положенні рівноваги. Відмітимо, що у випадку довільної орієнтації контура на нього з боку поля діє момент сили
(4.3)
або у скалярній формі
, (4.4)
де α кут між та (рис. 4.1).
В СІ магнітна індукція вимірюється в теслах:
.
Графічно магнітне поле зображають лініями магнітної індукції. Це такі лінії, дотичні до яких в кожній точці збігаються з напрямком в цій точці. Лінії магнітної індукції проводять з такою густиною, щоб число ліній, які перетинають нормальну до них площадку одиничної площі, дорівнювало в даному місці простору.
На відміну від ліній напруженості електростатичного поля (починаються на додатніх і закінчуються на відємних зарядах) лінії магнітної індукції не мають ні початку, ні кінця вони або охоплюють провідники зі струмом, або ідуть із нескінченності у нескінченість (рис. 4.2; 4.3). Магнітне поле є вихровим, що фізично обумовлено відсутністю у природі «магнітних зарядів».
Магнітне поле називається однорідним, якщо у всіх його точках . Лінії індукції однорідного поля паралельні прямі, проведені з однаковою густиною. Однорідним є поле всередині довгого соленоїда (рис. 4.3).
Досвід показує, що для магнітних полів справджується принцип суперпозиції: індукція магнітного поля, створеного кількома струмами, дорівнює векторній сумі індукцій полів, створених в даній точці простору кожним струмом окремо, тобто
. (4.5)
В магнетизмі всі струми поділяються на макроструми, що зумовлені напрямленим рухом вільних зарядів (електронів, дірок, іонів), і мікроструми, зумовлені рухом електронів в атомах (рис. 4.4).
У відсутності зовнішнього магнітного поля магнітні моменти мікрострумів, завдяки тепловому руху атомів, орієнтовані хаотично, і їхні магнітні поля в середньому скомпенсовані. В зовнішньому магнітному полі (полі макроструму) магнітні моменти атомів речовини набувають певної орієнтації, сумарне поле мікрострумів стає відмінним від нуля і за принципом суперпозиції, додається до поля макроструму. Фізична величина, яка показує у скільки разів індукція магнітного поля в середовищі (В) відрізняється від індукції поля макроструму , називається магнітною проникністю середовища
або , (4.6)
величина безрозмірна; для вакууму . В залежності від величини всі речовини (магнетики) поділяються на:
діамагнетики () (Bi, H2)
парамагнетики () (Al, Mn, O2)
феромагнетики () (Fe, Co, Ni, Gd).
Більш детально магнітні властивості речовин обговорюються в §4.10 даного розділу.
Історично склалось так, що поле макрострумів характеризується одночасно з іншою силовою характеристикою напруженістю поля . В СІ індукція і напруженість вимірюються в різних одиницях: , тому ці дві характеристики співпадають з точністю до постійного множника:
, (4.7)
де магнітна стала.
Звязок між індукцією і напруженості магнітного поля в середовищі встановимо, підставляючи (4.7) у (4.6),
. (4.8)
§4.2. Закон Біо-Савара-Лапласа. Магнітне поле прямолінійного та колового струмів
В 1820 році французькі вчені Х.Біо та Ф.Савар експериментально дослідили магнітні поля струмів, що течуть по провідниках різних конфігурацій (прямолінійний, коловий, соленоїд тощо). Узагальнюючи їх експериментальні результати, Лаплас сформулював диференціальний закон, що дістав назву закону Біо-Савара-Лапласа:
(4.9)
або в скалярній формі:
. (4.10)
Цей закон визначає індукцію магнітного поля, створеного елементом струму в точці простору, що описується вектором (проводиться від елемента струму до даної точки простору); α кут між елементом струму та вектором (рис. 4.5).
Напрямок визначається за правилом свердлика: якщо обертати свердлик так, щоб його вістря рухалось за напрямком струму, то ручка свердлика опише лінію магнітної індукції (рис. 4.5). Індукцію поля, створеного в даній точці простору всім провідником, знаходимо за принципом суперпозиції
(4.11)
Результат інтегрування виразу (4.11) залежить від форми провідника. Зокрема:
а) розрахуємо магнітне поле прямолінійного струму на відстані R від нього. Як видно з рис. 4.6,
,
,
звідки
.
Після підстановки двох останніх рівнянь у (4.10) одержимо
.
Проінтегрувавши останній вираз, отримаємо
;
; (4.12)
б) вираз для індукції та напруженості магнітного поля нескінченно довгого прямолінійного струму на відстані R від нього (рис. 4.7) одержимо після підстановки в (4.12) ; :
, ; (4.13)
в) магнітне поле в центрі колового струму (рис. 4.8)
, . (4.14)
§4.3. Циркуляція вектора напруженості магнітного поля. Вихровий характер магнітного поля. Поле довгого соленоїда
Циркуляцією вектора по замкненому контуру називається інтеграл де - вектор елементу довжини контура, напрямлений вздовж обходу контура, проекція на дотичну до контура, α кут між та (рис. 4.9).
Розглянемо найпростіший випадок магнітне поле нескінченно довгого прямолінійного струму. Лініями напруженості цього поля є кола, центри яких лежать на осі провідника, а площини перпендикулярні до нього.
Знайдемо циркуляцію вздовж кола радіусом R:
, (4.15)
бо .
В загальному випадку, коли провідник охоплений замкненою лінією довільної форми (рис. 4.10, а),
,
. (4.16)
Якщо контур не охоплює провідник зі струмом (рис. 4.10, б), то в (4.16) адже радіальна пряма спочатку рухається в одному напрямку (ділянка 1-2, ), а потім в іншому (ділянка 2-1, ). Отже,
. (4.17)
Якщо магнітне поле створюється кількома струмами , то за принципом суперпозиції і, враховуючи (4.16), остаточно одержимо
. (4.18)
Ця формула є математичним виразом теореми про циркуляцію вектора напруженості магнітного поля: циркуляція вектора напруженості магнітного поля дорівнює алгебраїчній сумі сил струмів, охоплених даним контуром (позитивним вважається струм, що звязаний з напрямком обходу правилом свердлика; струм протилежного напрямку вважається негативним). Вираз (4.18) є математичною ознакою вихрового характеру магнітного поля.
Використаємо теорему про циркуляцію для розрахунку магнітного поля довгого соленоїда циліндричної котушки, на яку намотано N витків дроту. Виберемо контур інтегрування у вигляді прямокутника ABCD, в якому сторона AD лежить всередині соленоїда і паралельна до його осі, а сторона ВС дуже віддалена від соленоїда (рис. 4.11).
Тоді згідно з (4.18)
. (4.19)
Магнітне поле соленоїда швидко зменшується при віддалені від нього, тому . Крім того, оскільки проекція на сторони AB і CD дорівнює нулю.
Отже, в лівій частині (4.19) залишається один доданок
.
Проекція на паралельний йому відрізок DA дорівнює модулю цього вектора: , а (довжина сторони DA).
Таким чином,
і , (4.20)
де кількість витків на одиниці довжини соленоїда (густина витків). Отже, напруженість магнітного поля всередині довгого соленоїда дорівнює добутку сили струму на густину витків, а індукція поля
. (4.21)
§4.4. Дія магнітного поля на струм; сила Ампера. Магнітна взаємодія струмів
Як відмічалося вище, магнітне поле діє на вміщений у нього провідник зі струмом. Французький фізик Ампер встановив, що на елемент провідника зі струмом , вміщений в магнітне поле індукцією , діє сила (сила Ампера)
(4.22)
або в скалярній формі
, (4.23)
де α кут між напрямками струму та магнітної індукції. Напрямок сили Ампера можна визначити за правилом лівої руки (рис. 4.12).
Сила, що діє на провідник зі струмом скінченої довжини, знаходиться з (4.22) або (4.23) інтегруванням по всій довжині провідника:
(4.24)
Зокрема, для прямолінійного провідника довжиною в однорідному магнітному полі
. (4.25)
Розглянемо тепер взаємодію двох довгих прямолінійних провідників, паралельних один одному і по яких протікають струми однакового напрямку. Ділянки таких провідників зображені на рис. 4.13.
Сила, з якою магнітне поле першого струму діє на ділянку другого провідника довжиною , згідно з (4.25)
.
Згідно з (4.13)
(d відстань між провідниками).
Як видно з рис. 4.13, кут α між напрямком струму в другому провіднику і вектором магнітної індукції поля першого провідника прямий; отже, .
Тоді одержимо
. (4.26)
Це і є вираз для сили взаємодії провідників зі струмом (адже так само можна отримати і вираз для сили ). Напрямки сил знайдені за правилом лівої руки і вказані на рис. 4.13. Отже, струми однакового напрямку притягуються. Аналогічно, можна показати, що антипаралельні струми будуть відштовхуватись.
Із формули (4.26), вважаючи в ній всі величини одиничними (за винятком ), отримаємо визначення одиниці сили струму: ампер це сила такого постійного струму, який при проходженні по двох прямолінійних паралельних нескінченно довгих провідниках, розміщених на відстані 1м у вакуумі, викликає між ними магнітну взаємодію силою на кожен метр довжини. Це визначення використовувалось в СІ до 90-их років минулого століття.
§4.5. Сила Лоренца. Рух електричних зарядів у магнітному полі
Досліди показують, що на електричний заряд, який рухається в магнітному полі, діє з боку поля сила (сила Лоренца), що напрямлена перпендикулярно до швидкості і пропорційна величині заряду і векторному добутку його швидкості та магнітної індукції:
(4.27)
або в скалярній формі
, (4.28)
де α кут між і .
Для додатнього заряду напрямок сили Лоренца визначається за правилом лівої руки (рис.4.14), а для відємного заряду цей напрямок протилежний (рис.4.15).
Окремо відмітимо, що на нерухомий заряд магнітне поле не діє; в цьому його принципова відмінність від електростатичного поля. Якщо ж на заряд q діють одночасно і електричне, і магнітне поле, то результуюча сила (що також називається силою Лоренца)
, (4.29)
де напруженість електростатичного поля. Очевидно, що (4.27) є окремим випадком (4.29) у разі, коли електростатичне поле відсутнє.
Якщо заряджена частинка рухається вздовж ліній магнітної індукції (або у протилежному напрямку), то або . Згідно з (4.28) у цьому випадку магнітне поле на частинку не діє, і вона рухається рівномірно і прямолінійно. Якщо ж швидкість частинки , то максимальна. Оскільки перпендикулярна до швидкості, то вона надає частинці нормального прискорення; отже, частинка буде рухатися по колу в площині, перпендикулярній до напрямку магнітного поля. Згідно з 2-м законом Ньютона
,
звідки радіус кола
, (4.30)
а період обертання
. (4.31)
Якщо ж швидкість частинки складає довільний кут α з напрямком магнітної індукції , то її рух можна розглядати (рис. 4.16) як суперпозицію рівномірного прямолінійного руху вздовж поля зі швидкістю і рівномірного руху по колу радіуса в площині, перпендикулярній до поля. Результатом суперпозиції буде рух по спіралі (рис. 4.16). Крок спіралі
. (4.32)
Напрямок, в якому закручується спіраль, залежить від знаку заряду частинки.
З попереднього розгляду видно, що сила Лоренца при русі заряду в магнітному полі роботи не виконує; вона перпендикулярна до швидкості, отже змінює лише напрямок швидкості, не змінюючи її модуля.
§4.6. Магнітний потік. Теорема Гауса для магнітного поля
Магнітним потоком через елементарну площадку називається фізична величина, що дорівнює скалярному добутку вектора магнітної індукції та площі площадки:
, (4.33)
де проекція на нормаль до площадки; кут між векторами та (рис.4.17).
Якщо врахувати правила побудови ліній магнітної індукції (див. §4.1), то стає очевидним фізичний зміст магнітного потоку: він чисельно дорівнює кількості ліній магнітної індукції, що перетинають дану площадку. Магнітний потік через довільну поверхню знайдемо інтегруванням (4.33) по площі поверхні:
. (4.34)
Зокрема, для плоскої поверхні в однорідному магнітному полі
. (4.35)
В СІ одиницею вимірювання магнітного потоку є вебер:
.
Магнітний потік може бути як додатнім, так і відємним, в залежності від знаку (визначається позитивним напрямком нормалі ).
Теорема Гауса для магнітного поля: магнітний потік через будь-яку замкнену поверхню дорівнює нулю:
. (4.36)
Ця теорема є наслідком того, що в природі не існує «магнітних зарядів», лінії магнітної індукції не мають ні початку, ні кінця (див. §4.1), тому число ліній, що входять в довільну замкнену поверхню, дорівнює числу ліній, що виходять з неї.
§4.7. Робота переміщення провідника та контура зі струмом в магнітному полі
Нехай у магнітному полі індукцією під дією сили Ампера переміщується провідник зі струмом (рис.4.18). Робота сили Ампера на елементарному переміщенні
, (4.37)
площа, яку перетнув провідник, магнітний потік, який перетнув провідник. Зауважимо, що фактично роботу виконує джерело струму, яке підтримує постійне значення сили струму. Повну роботу, виконану силою Ампера при русі провідника знайдемо, інтегруючи (4.37). Якщо сила струму в провіднику залишається постійною, то
. (4.38)
Повна робота дорівнює добутку сили струму на величину магнітного потоку, який перетинає провідник під час свого руху.
Нехай тепер у магнітному полі переміщується контур зі струмом з положення у положення , як показано на рис. 4.19.
Роботу переміщення контура можна розглядати як суму робіт по переміщенню його сторін: . Очевидно, що , оскільки сили Ампера, що діють на ці сторони, перпендикулярні до їх переміщень, отже роботи не виконують. (сила Ампера напрямлена проти переміщення); (сила Ампера діє в напрямку переміщення).
Отже, . З використанням (4.38) останній вираз запишемо у вигляді . Після скорочення одержимо
(4.39)
Робота переміщення контура зі струмом в магнітному полі дорівнює добутку сили струму на зміну магнітного потоку через площу контура в його кінцевому і початковому положенні. Вираз (4.39) залишається справедливим для контура довільної форми і довільної орієнтації в магнітному полі, а, отже, і при повороті контура. При цьому сила струму в контурі має підтримуватись постійною.
§4.8. Явище електромагнітної індукції. Закон Фарадея. Правило Ленца
Як показав Ерстед (див. §4.1.), магнітне поле породжується провідниками зі струмом. Виникає питання: чи не можна створити електричний струм за допомогою магнітного поля? Це питання експериментальним шляхом розвязав М.Фарадей в 1837 році. Він встановив, що в замкненому контурі виникає електричний струм, якщо площину охоплену контуром, перетинає змінний магнітний потік, тобто, якщо Цей струм Фарадей назвав індукційним (наведеним), а саме явище явищем електромагнітної індукції. Зрозуміло, що в цій ситуації виникнення струму є вторинним ефектом; первинним є виникнення електрорушійної сили індукції.
Отже, явищем електромагнітної індукції називається виникнення електрорушійної сили в контурі при зміні магнітного потоку через поверхню, обмежену контуром. Величина е.р.с. індукції дорівнює швидкості зміни магнітного потоку (закон Фарадея):
. (4.40)
Знак “” в законі Фарадея відповідає правилу Ленца: індукційний струм завжди має такий напрямок, щоб своїм магнітним полем протидіяти зміні магнітного потоку, який викликає появу цього струму. Правило Ленца відображає закон збереження енергії стосовно явища електромагнітної індукції: якби індукований магнітний потік, всупереч правилу Ленца , сприяв зростанню швидкості зміни індукуючого потоку, то це призвело б до збільшення струму, в результаті чого збільшився б магнітний потік, знову збільшився б індукційний струм, і так до нескінченості. Зрозуміло, що такий «саморозгін» суперечить закону збереження енергії.
Розглянемо тепер електронний механізм виникнення е.р.с. індукції. Із закону Фарадея випливає, що будь-яка зміна магнітного потоку через площину контура викликає появу е.р.с. індукції і, якщо контур замкнений, індукційного струму. Можливі два випадки:
а) провідний контур, одна з сторін якого переміщується, міститься в постійному магнітному полі (рис. 4.20). Нехай одна з сторін контура рухається зі швидкістю . З такою ж швидкістю рухаються вільні заряди, що входять до складу провідника. На рухомі заряди магнітне поле діє з силою Лоренца Напруженість поля цієї сторонньої сили . Е.р.с. індукції, за означенням
,
що з точністю до знаку співпадає із законом Фарадея (4.40). Тобто в цьому випадку (рухомий контур в постійному магнітному полі) причиною виникнення індукційного струму є дія сили Лоренца на рухомі вільні заряди контура.
б) : нерухомий контур знаходиться в змінному магнітному полі. Виникнення е.р.с. індукції в цьому випадку неможливо пояснити дією сили Лоренца адже на нерухомі (в середньому) заряди магнітне поле не діє. Наприкінці XIX ст. Максвелл висунув гіпотезу про те, що змінне магнітне поле породжує навколо себе вихрове електричне поле, яке і діє на нерухомі електричні заряди контура, викликаючи появу індукційного струму. Докладніше це питання обговорюватиметься в §4.11.
§4.9. Індуктивність контура. Явище самоіндукції. Енергія магнітного поля
Нехай по замкненому контуру протікає струм силою І. Індукція магнітного поля, створеного цим струмом, пропорційна до сили струму (, див.§4.2). Величина ж магнітного потоку пропорційна до індукції магнітного поля (, див. §4.6). Отже, магнітний потік через площину контура пропорційний до сили струму в контурі: або
, (4.41)
де L коефіцієнт пропорційності між силою струму в контурі і магнітним потоком, що перетинає цей контур, який називається індуктивністю контура. Одиницею вимірювання індуктивності в СІ є генрі:
.
Індуктивність контура залежить від його розмірів і форми, а також від магнітної проникливості навколишнього середовища. Як приклад, знайдемо вираз для індуктивності довгого соленоїда котушки довжиною і площею поперечного перерізу S, що складається з N витків дроту. При проходженні через соленоїд струму в ньому виникає магнітне поле з індукцією , напрямлене вздовж осі соленоїда (див. 4.21). Тоді кожен виток соленоїда перетинає магнітний потік , а повний магнітний потік через соленоїд . Оскільки число витків на одиниці довжини соленоїда, то
. (4.42)
Прирівнюючи (4.41) і (4.42), отримаємо для індуктивності соленоїда
, (4.43)
де магнітна проникливість матеріалу осердя.
Якщо сила струму в контурі змінюється, то змінюється і магнітний потік через контур. Згідно з законом Фарадея (4.40) зміна магнітного потоку викликає появу е.р.с. індукції, яка в даному випадку називається е.р.с. самоіндукції.
Отже, явище самоіндукції полягає у виникненні е.р.с. самоіндукції в контурі, по якому тече змінний електричний струм. Вираз для е.р.с. самоіндукції одержимо, підставивши (4.41) в (4.40):
. (4.44)
Якщо в контурі немає феромагнітних матеріалів, для яких , то і (4.44) спрощується:
, (4.45)
тобто е.р.с. самоіндукції пропорційна до швидкості зміни сили струму в контурі.
Таким чином, в контурі, по якому тече змінний струм, діють дві електрорушійні сили: е.р.с. джерела струму та е.р.с. самоіндукції. Якщо струм в контурі збільшується , то . Це означає, що е.р.с. самоіндукції виконує відємну роботу, гальмує рух зарядів і тим самим зменшує силу струму в контурі. В даному випадку струм самоіндукції напрямлений проти основного струму. Якщо ж струм в контурі зменшується , то робота цієї е.р.с. буде додатньою, а збуджений нею індукційний струм матиме той же напрямок, що і основний струм. Таким чином, і при збільшенні, і при зменшенні сили основного струму е.р.с. самоіндукції протидіє його зміні, тобто тій причині, яка її викликає. В цьому полягає фізичний зміст правила Ленца для явища самоіндукції.
Індукційні струми можуть збуджуватись не тільки в тонких провідниках, які звичайно застосовують в електротехніці, а і в масивних провідниках великих розмірів: барабанах і дисках приладів, осердях котушок тощо. Струми всередині таких суцільних тіл являють собою вихровий рух вільних електронів, тому індукційні струми в масивних тілах (струми Фуко) іноді називають вихровими.
Провідник зі струмом завжди оточений магнітним полем, яке зявляється та зникає разом зі струмом. Очевидно, що енергія магнітного поля дорівнює роботі, виконаній джерелом при створенні цього струму. Розглянемо контур індуктивністю L, по якому тече струм силою І. Його перетинає власний магнітний потік . При зміні сили струму на dI магнітний потік змінюється на . При цьому, згідно з (4.37), джерело струму виконує роботу . Інтегруючи останній вираз, одержимо . Отже, енергія магнітного поля, створеного струмом контура,
. (4.46)
Знайдемо тепер енергію магнітного поля всередині довгого соленоїда. Підставивши (4.43) у (4.46), отримаємо
.
Враховуючи, що обєм магнітного поля практично співпадає з обємом соленоїда , а напруженість магнітного поля в соленоїді , останній вираз запишемо у вигляді
. (4.47)
Введемо тепер поняття густини енергії магнітного поля як енергії одиниці обєму поля
. (4.48)
Підставивши (4.47) у (4.48), одержимо вираз для густини енергії магнітного поля
. (4.49)
Цей вираз для густини енергії магнітного поля лишається справедливим для полів, створених провідниками будь-якої форми, а також для полів постійних магнітів.
§4.10. Магнітне поле в речовині
Всі речовини складаються з атомів, в яких по замкнених траєкторіях рухаються електрони. Орбітальний рух електрона можна розглядати як коловий струм (мікрострум) з магнітним моментом
частота обертання електрона, r радіус орбіти, одиничний вектор позитивної нормалі до площини орбіти. Магнітний момент атома дорівнює векторній сумі магнітних моментів усіх його електронів (магнітним моментом ядра можна знехтувати):
.
В залежності від наявності чи відсутності (рівності нулю) магнітного моменту, всі атоми поділяються на діамагнітні, для яких і парамагнітні, для яких .
Будь-яка речовина, як система атомів, в зовнішньому магнітному полі намагнічується, тобто набуває магнітного моменту. Для кількісного опису цього явища вводять вектор намагніченості фізичну величину, що дорівнює магнітному моменту одиниці обєму магнетика:
. (4.50)
Встановлено, що вектор намагніченості пропорційний до вектора напруженості намагнічуючого поля:
, (4.51)
де безрозмірний коефіцієнт пропорційності називається магнітною сприйнятливістю речовини.
Таким чином, магнітне поле в речовині складається з зовнішнього (намагнічуючого) поля , створеного макрострумами, і власного поля , створеного мікрострумами. В діамагнітних речовинах власне поле напрямлене проти зовнішнього, а в парамагнітних напрямки зовнішнього і власного полів співпадають. За принципом суперпозиції магнітна індукція поля в речовині
Безрозмірна величина називається магнітною проникністю речовини. Тоді остаточно запишемо
(4.52)
Тепер дамо елементарне пояснення природи діа- і парамагнетизму. У діамагнетиків сумарний магнітний момент атомів у відсутності зовнішнього поля дорівнює нулю. Досліди показують, що магнітного моменту не має атом гелію. Цей факт можна пояснити, припустивши, що два електрони атома гелію обертаються навколо ядра по орбітах рівних радіусів, з рівними за величиною швидкостями, але в протилежних напрямках. Тому їхні магнітні моменти взаємно скомпенсовані і результуючий магнітний момент атома дорівнює нулю. Зовнішнє магнітне поле, впливаючи на рух електронів атома, індукує в ньому магнітний момент, який за правилом Ленца (див. §4.8.) напрямлений проти . З розглянутої моделі слід очікувати, що діамагнетиками є й інші речовини, атоми яких мають парне число електронів у зовнішній оболонці. Дійсно, до класу діамагнетиків належать інертні гази (He, Ne, Ar, Xe), а також ряд інших речовин Bi, H2O тощо. У діамагнетиків .
Парамагнетиками є речовини, атоми або молекули яких у відсутності зовнішнього поля мають відмінний від нуля магнітний момент ; наприклад, якщо вони мають непарне число електронів в атомі. Тепловий рух робить орієнтацію магнітних моментів атомів хаотичною, тому у відсутності зовнішнього поля парамагнетик не намагнічений . В зовнішньому полі магнітні моменти атомів орієнтуються вздовж поля (див.§4.1.), тому парамагнетик намагнічується в напрямку зовнішнього поля. Для парамагнетиків . Магнітна сприйнятливість парамагнетика в слабких полях і при досить високих температурах обернено пропорційна до температури (закон Кюрі): , де С стала Кюрі, що залежить від роду парамагнетика.
І діа- і парамагнетики належать до слабомагнітних речовин, оскільки для обох Але існують сильномагнітні речовини феромагнетики, у яких магнітна проникливість досягає . Крім основного представника заліза, до феромагнетиків належать Co, Ni, ряд рідкісноземельних елементів та сплавів на їх основі. Відома наступна властивість феромагнетиків: при температурі, що називається точкою Кюрі (залежить від речовини), феромагнетик стрибком втрачає свої феромагнітні властивості і переходить у парамагнітний стан. Це означає, що атом феромагнетика подібний до атома парамагнетика відмінністю від нуля магнітного моменту, а феромагнітні властивості притаманні не окремому атому, а кристалу феромагнітної речовини в цілому при температурах, нижчих від точки Кюрі.
Крім великої магнітної проникливості феромагнетики відрізняються від слабомагнітних речовин рядом властивостей:
При розміщенні розмагніченого феромагнетика в зовнішньому полі залежність В(Н) описується спочатку кривою 0-1. При зменшенні Н до нуля В(Н) змінюється по кривій 1-2; тобто має місце відставання зміни індукції від зміни напруженості. Це явище називається магнітним гістерезисом. Магнітна індукція, що зберігається у феромагнетику після зникнення зовнішнього поля (при Н = 0), називається залишковою магнітною індукцією (постійні магніти). Щоб розмагнітити феромагнетик, потрібно прикласти зовнішнє поле протилежного напрямку з напруженістю , яка називається коерцитивною силою. При подальшому збільшенні напруженості відбувається намагнічування протилежного напрямку по кривій 3-4. Ділянка 4-5-6 знову відповідає розмагнічуванню. Надалі процес перемагнічування відбувається по замкненій кривій 6-1-2-3-4-5-6 (рис. 4.22), яка називається петлею гістерезису. В залежності від величини Нс усі феромагнітні матеріали поділяють на жорсткі (рис.4.22, а) і мякі (рис.4.22, б).
Властивості феромагнетиків пояснюються наявністю в них областей, які у відсутності зовнішнього поля спонтанно намагнічені до насичення; ці області називаються доменами. Розміри доменів ~ () м. Розташування і намагніченість доменів такі, що у відсутності зовнішнього поля сумарна намагніченість дорівнює нулю. В зовнішньому полі вектори намагніченості доменів частково повертаються в напрямку поля і феромагнетик намагнічується.
§4.11. Вихрове електричне поле
Розглянемо замкнений провідний контур, що перебуває в змінному магнітному полі (рис 4.23). Згідно з законом Фарадея (див. §4.8), в цьому контурі індукується електрорушійна сила
(4.53)
і, як наслідок, виникає індукційний струм; тобто на вільні заряди контура діють сторонні сили. Оскільки контур нерухомий, то ці сили не можна ототожнити з силою Лоренца. Для відповіді на питання про природу сторонніх сил в розглянутому випадку Максвелл висунув гіпотезу про те, що змінне магнітне поле породжує в навколишньому просторі (навіть без провідного контура) вихрове електричне поле, яке і викликає появу індукційного струму. Напруженість цього поля позначають , на відміну від напруженості електростатичного поля (створеного електричними зарядами), яку будемо надалі позначати Тоді за означенням електрорушійної сили:
. (4.54)
З (4.53) і (4.54) одержимо
.
Оскільки контур нерухомий, то в останньому рівнянні можна поміняти місцями операції інтегрування та диференціювання. І врахувавши, що в загальному , запишемо
(4.55)
На відміну від електростатичного, поле , породжене змінним магнітним полем, є вихровим, бо його циркуляція відмінна від нуля , і тому силові лінії цього поля замкнені.
Якщо ж у просторі одночасно існують і вихрове (), і електростатичне() поля, то за принципом суперпозиції напруженість результуючого поля
.
Як було показано в розділі 3, ч.1, циркуляція напруженості електростатичного поля Тому рівняння (4.55) можна узагальнити:
(4.56)
Ми отримали перше рівняння Максвелла: циркуляція вектора напруженості електричного поля дорівнює взятій з протилежним знаком швидкості зміни магнітного потоку через довільну поверхню, що опирається на контур циркуляції (рис. 4.23).
§4.12. Струми зміщення. Теорема про циркуляцію вектора напруженості магнітного поля (закон повного струму)
У відповідності із законом Біо-Савара-Лапласа (див. §4.2), електричний струм завжди породжує магнітне поле. Але струм це напрямлений рух електричних зарядів. Навколо ж заряду, як нерухомого, так і рухомого, існує електричне поле. Можна сказати, що змінне в просторі електричне поле породжує магнітне поле, і закон Біо-Савара-Лапласа є математичним відображенням цього факту. Максвелл же висунув гіпотезу про те, що не тільки змінне в просторі, а і змінне в часі електричне поле породжує магнітне поле. На практиці змінне в часі електричне поле отримаємо, наприклад, в процесі розрядки конденсатора. Якщо обкладки конденсатора, зарядженого з поверхневою густиною заряду , сполучити провідником (рис. 4.24), то по провіднику потече електричний струм (струм провідності) , де S площа пластини конденсатора. Густина струму провідності
. (4.57)
Але між обкладками конденсатора впорядкований рух зарядів припиняється. Виникає питання: чи зникає там і магнітне поле, яке завжди повязане зі струмом? Гіпотеза Максвелла (пізніше підтверджена експериментально) полягає у тому, що магнітне поле існує і між обкладками конденсатора, оскільки там існує змінне в часі електричне поле. Силовою характеристикою електричного поля в конденсаторі є вектор електричного зміщення модуль якого, як показано в розділі 3 ч.1, дорівнює поверхневій густині вільних зарядів на обкладках конденсатора: . Оскільки в процесі розрядки конденсатора поверхнева густина заряду зменшується, існує відмінна від нуля похідна
(4.58)
Цю похідну Максвелл і назвав густиною струму зміщення; цей струм не пов'язаний з рухом зарядів в просторі між обкладками конденсатора, він існує незалежно від того, чи є в конденсаторі діелектрик, чи там вакуум. Потрібно лише, щоб існувало змінне електричне поле, яке викликає струм зміщення і породжене ним магнітне поле. З (4.57) і (4.58) видно, що , тобто струм провідності в провіднику неперервно переходить в струм зміщення в діелектрику (або у вакуумі) (рис. 4.24).
Максвелл ввів також поняття повного струму, як суму струмів провідності та зміщення,
. (4.59)
В розімкненому електричному колі лінії повного струму завжди замкнені: в провідниках вони повязані з напрямленим рухом електричних зарядів, а в діелектриках (або вакуумі) зі змінним електричним полем.
В §4.3 була встановлена теорема про циркуляцію вектора напруженості магнітного поля струму провідності:
. (4.60)
По теорії Максвелла, в правій частині (4.60) повинна стояти сила повного струму. Отже, після підстановки (4.59) в (4.60) одержимо . Або, якщо виразити силу струму через його густину, а також врахувати (4.58), останній вираз можна записати у вигляді
. (4.61)
Рівняння (4.61) носить назву закону повного струму або 3-го рівняння Максвелла: циркуляція вектора напруженості магнітного поля дорівнює алгебраїчній сумі сил струмів провідності та струмів зміщення через поверхню S, обмежену контуром циркуляції.
§4.13. Система рівнянь Максвелла. Електромагнітне поле
Узагальнивши теоретично закони електромагнетизму, що були відкриті дослідним шляхом, та доповнивши їх гіпотезою про існування струмів зміщення, Максвелл склав систему чотирьох фундаментальних рівнянь електродинаміки, які описують усі явища електромагнетизму. В інтегральній формі вони мають вигляд:
. (4.62)
Зміст першого і третього рівнянь обговорювався в §§4.11, 4.12, відповідно. Друге рівняння Максвелла це теорема Гауса для електростатичного поля (див. розділ 3, ч.1). Четверте рівняння Максвелла це теорема Гауса для магнітного поля (див. §4.6).
Систему рівнянь Максвелла слід доповнити трьома допоміжними рівняннями, які встановлюють зв'язок між фізичним величинами, що використовуються в (4.62)
(4.63)
Останнє рівняння закон Ома в диференціальній формі.
Одним з важливих висновків з аналізу рівнянь Максвелла є той, що змінні електричне та магнітне поля не можуть існувати окремо. Змінне електричне поле збуджує в просторі змінне магнітне поле і, навпаки, змінне магнітне поле викликає появу змінного електричного поля. Змінне електричне і нерозривно повязане з ним магнітне поле утворюють єдине електромагнітне поле.
Розділ 5. Коливання і хвилі
§5.1. Гармонічні коливання. Диференціальне рівняння гармонічних коливань та його розвязок. Амплітуда, фаза, частота, період коливань
Коливаннями називають процеси, які повторюються з певною періодичністю. В залежності від механізму виникнення коливань розглядають механічні, електромагнітні, електромеханічні і т. п. коливання, а в залежності від характеру сил, що діють на коливну систему, вільні (власні), згасаючі, вимушені тощо.
Розгляд почнемо з власних механічних коливань горизонтального пружинного маятника, який складається з тіла масою m, закріпленого до кінця пружини, що жорстко прикріплена до стінки (рис. 5.1).
Якщо вивести тіло з положення рівноваги, то на нього почне діяти повертаюча сила пружної деформації пружини, яка задається законом Гука . Якщо знехтувати тертям і масою пружини у порівнянні з масою тіла, то при невеликих деформаціях пружини закон руху ІІ закон Ньютона запишеться як
, (5.1)
де k коефіцієнт пружності (жорсткість пружини), х зміщення тіла від положення рівноваги, ах прискорення вздовж осі Х. В подальшому всяку силу, пропорційну до зміщення і напрямлену до положення рівноваги, будемо називати квазіпружною, незалежно від її природи.
Оскільки прискорення , то (5.1) можна переписати як
або
. (5.2)
У рівнянні (5.2) , тому можна ввести позначення
, (5.3)
де називають власною циклічною частотою коливань.
Підставляючи (5.3) у (5.2), одержимо диференціальне рівняння коливань не тільки пружинного маятника, але усякого тіла (матеріальної точки), на яке діє квазіпружна сила:
. (5.4)
Легко показати, що розвязком цього рівняння є гармонічні функції (рис. 5.2)
або . (5.5)
Коливання, в яких зміна фізичної величини в залежності від часу відбувається за законом синуса або косинуса, називаються гармонічними. В (5.5): А амплітуда коливань найбільше значення коливної фізичної величини (у даному випадку, максимальне зміщення від положення рівноваги), фаза коливань, початкова фаза.
Проміжок часу, протягом якого здійснюється одне повне коливання, називається періодом коливань Т. Зрозуміло, що , оскільки гармонічні функції повторюються через 2. Звідси циклічна частота
(5.6)
де лінійна частота, як кількість коливань, здійснених за одиницю часу.
Для пружинного маятника , тому період коливань
. (5.7)
§5.2. Математичний маятник
Математичний маятник це підвішена на довгій нерозтяжній невагомій нитці матеріальна точка (тіло, розмірами якого нехтують), що здійснює коливання під дією тангенціальної складової сили тяжіння (рис. 5.2) повертаючої сили
,
напрямленої до положення рівноваги. При малих кутах відхилення і
, (5.8)
тобто ця сила є квазіпружною Вона забезпечує тангенціальне прискорення точки
. (5.9)
За ІІ законом Ньютона
. (5.10)
Підставляючи (5.8) і (5.9) у (5.10), отримаємо
а ввівши позначення , остаточно
. (5.11)
Зрозуміло, що це дифрівняння, як і (5.4), має розвязки у вигляді гармонічних функцій (5.5). Отже, при малих кутах відхилень математичний маятник здійснює гармонічні коливання з періодом
.
§5.3.Фізичний маятник
Фізичний маятник це тіло, яке може коливатись навколо осі, що не проходить через його центр мас (рис. 5.4). На рис. 5.4: O точка підвісу маятника, через яку перпендикулярно до площини рисунка проходить вісь коливання; віддаль від осі до центра мас тіла. Повертаючою силою є тангенціальна складова сили тяжіння , яка при малих кутах відхилення є квазіпружною:
. (5.12)
Момент цієї сили відносно осі О
. (5.13)
За основним законом динаміки обертального руху
, (5.14)
де І момент інерції фізичного маятника, кутове прискорення. Підставляючи (5.13) у (5.14), одержимо
або
. (5.15)
Вираз (5.15) є диференціальним рівнянням гармонічних коливань фізичного маятника з власною циклічною частотою
або
де зведена довжина фізичного маятника.
Період коливань фізичного маятника
.
Зведена довжина фізичного маятника це довжина такого математичного маятника, який має такий самий період коливання, як і даний фізичний.
§5.4. Енергія гармонічних коливань
Оскільки квазіпружна сила, що є причиною гармонічних коливань, є потенціальна, то у випадку механічних коливань коливне тіло має як кінетичну, так і потенціальну енергію. Повна енергія дорівнює їх сумі
.
З врахуванням (5.5) для матеріальної точки отримаємо кінетичну енергію
. (5.16)
Потенціальна енергія матеріальної точки, яка здійснює гармонічні коливання,
. (5.17)
Склавши (5.16) і (5.17), отримаємо повну енергію
.
Отже, енергія гармонічних коливань пропорційна до квадрату амплітуди і не залежить від часу.
§5.5. Додавання однаково направлених гармонічних коливань однакової частоти
Часто матеріальна точка бере участь у двох і більше коливаннях. Наприклад, підвішена до стелі вагона на пружині кулька здійснює коливання відносно точки підвісу, яка у свою чергу коливається на ресорах вагона; таким чином, кулька буде здійснювати рух, який складається із двох коливань одного напрямку.
Нехай матеріальна точка бере участь у двох однаково направлених гармонічних коливаннях однакової частоти, але з різними амплітудами і початковими фазами:
,
.
Очевидно, результуюче коливання є також гармонічним і буде описуватись виразом
.
Одержати цей вираз можна аналітично, але легше скласти коливання векторним способом. Для цього у момент часу побудуємо векторну діаграму додавання цих коливань (рис. 5.5), відклавши амплітуди як вектори під кутом та до осі x.
Оскільки вектори амплітуд обертаються з однаковою кутовою швидкістю, рівною циклічній частоті ω, то кут між векторами і залишається рівним . Тоді результуючий вектор
.
З рис. 5.5 за теоремою косинусів маємо
або
. (5.18)
З рис. 5.5 видно, що початкову фазу результуючого коливання можна визначити за співвідношенням
.
Із (5.18) випливає, що А залежить від різниці початкових фаз , тому
.
Зокрема, коли , де , то ; коливання, що додаються, здійснюються «у фазі». Коли ж , то ; коливання здійснюються «у протифазі».
Якщо і близькі, то результуюча частота , і амплітуда результуючого коливання повільно і періодично змінюється. Це явище називається биттям.
§5.6. Додавання взаємно перпендикулярних коливань
Нехай точка бере участь одночасно у двох взаємно перпендикулярних коливаннях однакової частоти:
(5.19)
, (5.20)
де А і В, α і β відповідно амплітуди і початкові фази першого і другого коливань.
Встановимо рівняння траєкторії точки, виключивши із (5.19) і (5.20) час . Для цього перепишемо (5.19) і (5.20) у вигляді
, (5.21)
. (5.22)
Помноживши (5.21) на і (5.22) на та взявши різницю між отриманими рівняннями, одержимо
. (5.23)
Помноживши (5.21) на і (5.22) на та взявши їх різницю, одержимо
. (5.24)
Складаючи квадрати рівнянь (5.23) і (5.24), знайдемо рівняння траєкторії
. (5.25)
Рівняння (5.25) є рівнянням еліпса, характеристики якого визначаються значенням різниці початкових фаз (β α).
Розглянемо частинні випадки:
1) Нехай де ; тоді а і рівняння (5.25) матиме вигляд
або .
Ми отримали рівняння прямої
яка проходить через початок координат і утворює з віссю ОХ кут, тангенс якого рівний . Таким чином, результуючий рух в цьому випадку є коливанням по заданому відрізку прямої.
2) Нехай ; тоді . Траєкторією результуючого руху тепер буде еліпс, який описується рівнянням
. (5.26)
При (5.26) переходить у коло. При проміжних значеннях утворюються еліпси з різною орієнтацією своїх осей відносно осей координат.
Якщо взаємно перпендикулярні коливання відбуваються з різними частотами, то результуючі траєкторії мають більш складний вигляд; ці траєкторії у випадках кратних частот називаються фігурами Ліссажу.
§5.7. Згасаючі коливання
Реальні коливання відбуваються в умовах дії сил тертя (опору). І тому реальні коливні системи є дисипативними, в яких механічна енергія частково втрачається, що призводить до поступового зменшення амплітуди, тобто до згасання коливань. Для спрощення обмежимось випадком лінійного коливання матеріальної точки у вязкому середовищі. Якщо швидкість коливального руху невелика, то сила опору пропорційна до швидкості і напрямлена проти швидкості, тобто
,
де r коефіцієнт опору.
Тоді за другим законом Ньютона
. (5.27)
Розділивши рівність (5.27) на m, отримаємо
. (5.28)
Введемо позначення
.
Рівняння (5.28) матиме вигляд диференціального рівняння згасаючих коливань:
. (5.29)
Підстановкою
(5.30)
приведемо рівняння (5.29) до простішого вигляду (тут е основа натурального логарифму). Заміну змінних у (5.29) проведемо за допомогою рівнянь
(5.31)
Підставляючи (5.30) і (5.31) у (5.29), отримаємо
або
. (5.32)
У випадку, коли , можна ввести заміну Тоді рівняння (5.32) прийме вигляд
(5.33)
розвязком якого є
. (5.34)
У випадку, коли , рух матеріальної точки буде неперіодичним (аперіодичним).
Підставляючи (5.34) у (5.30), одержимо рівняння руху коливної точки під дією квазіпружної сили та сили опору, тобто рівняння згасаючих коливань:
. (5.35)
З (5.35) видно, що амплітуда коливань зменшується з часом за експоненціальним законом (рис. 5.6):
. (5.36)
Фізично β характеризує швидкість зменшення амплітуди і називається коефіцієнтом згасання. Можна показати, що β чисельно дорівнює оберненій величині часу τ, протягом якого амплітуда зменшується в е раз. Дійсно, якщо , то із (5.36) слідує, що
.
Звідси
.
Зручно користуватись поняттям логарифмічного декременту згасання λ, як натурального логарифму відношення двох послідовних амплітуд (через період Т):
.
§5.8. Вимушені коливання
Для того, щоб в реальній коливній системі забезпечити незгасаючі коливання, необхідно постійно до неї підводити енергію ззовні. І тому розглянемо коливання матеріальної точки, на яку, крім квазіпружної сили і сили опору , діє додаткова періодична змушувальна сила
,
де частота цієї сили.
Тоді за другим законом Ньютона маємо
. (5.37)
Перепишемо рівняння (5.37) у вигляді
або
, (5.38)
де .
Розвязок рівняння (5.38) будемо шукати як суму розвязку однорідного рівняння (5.29) і часткового розвязку неоднорідного рівняння: . Для віддалених моментів часу . І тому
. (5.39)
Отже, вимушені коливання здійснюються з частотою ω. Для знаходження амплітуди А і початкової фази α продиференціюємо двічі (5.39):
(5.40)
Підставляючи (5.39) і (5.40) у (5.38), отримаємо:
а розкриваючи тригонометричні функції від складного аргументу:
(5.41)
Щоб рівняння (5.41) перетворилося в тотожність, потрібно, щоб суми коефіцієнтів при в обох частинах рівності були рівні і суми коефіцієнтів при в обох частинах були також рівні. Це означає, що
, (5.42)
. (5.43)
Із рівняння (5.43) отримаємо вираз для початкової фази вимушених коливань:
. (5.44)
Підносячи до квадрату рівняння (5.42) і (5.43) та складаючи отримані вирази, одержимо:
Звідси амплітуда вимушених коливань
. (5.45)
Проаналізуємо аналітично і графічно (рис. 5.7) залежність цієї величини від частоти при різних значеннях коефіцієнту згасання β. Зокрема:
1) при
2) при
3) при ;
Досягнення максимального значення амплітуди вимушених коливань, коли частота ω наближається до власної частоти ω0, називається резонансом.
Для знаходження резонансної частоти при знайдемо мінімум підкореневого виразу рівняння (5.45). Для цього прирівняємо до нуля похідну від цього виразу по :
.
Оскільки , то знаменник (5.45) досягає мінімуму при
.
Отже, резонансна частота
.
Резонансна (максимальна) амплітуда досягає значення
.
Зрозуміло, що резонанс тим гостріший, чим менший коефіцієнт згасання. На практиці слід враховувати явище резонансу, оскільки в техніці він в одних випадках відіграє позитивну роль, а в інших негативну.
§5.9. Поняття хвилі, рівняння хвилі. Поздовжні і поперечні хвилі. Фронт хвилі і хвильові поверхні. Довжина хвилі, хвильове число, фазова швидкість
Хвиля це процес поширення коливань у середовищі. Якщо коливання створити в деякій обмеженій частині середовища, то внаслідок наявності звязку між молекулами середовища коливання будуть охоплювати все середовище, тобто будуть поширюватись у середовищі.
Частинки середовища, в якій поширюється хвиля, не переносяться хвилею, вони лише здійснюють коливання навколо положення рівноваги. Хвилі, в яких частинки коливаються перпендикулярно до напрямку поширення хвилі, називаються поперечними. Хвилі, в яких частинки коливаються вздовж напрямку поширення хвилі, називаються поздовжніми. Поперечні хвилі поширюються в середовищах, де має місце деформація зсуву, тобто в твердих тілах. Поздовжні хвилі поширюються в середовищах, де має місце деформацію розтягу (розширення, стиску), тобто в газах, рідинах і твердих тілах.
Геометричне місце точок, до яких доходять коливання в момент часу t, називається фронтом хвилі. Геометричне місце точок, які коливаються в однаковій фазі, називається хвильовою поверхнею. Фронт хвилі весь час переміщується, а хвильові поверхні залишаються нерухомими (хвильових поверхонь існує безліч). Хвильові поверхні можуть бути довільної форми. Найпростіші хвильові поверхні мають вигляд сфер або площин. Тоді такі хвилі називаються сферичними або плоскими. Сферичні хвилі поширюються від точкових джерел, плоскі від безмежно віддалених джерел в однорідних ізотропічних середовищах.
Встановимо рівняння плоскої хвилі, що поширюється вздовж осі x. Це рівняння повинно виражати залежність змінної фізичної величини (наприклад, зміщення коливної точки) від координати x і часу t:
.
Знайдемо вигляд ξ у випадку плоскої хвилі. Для спрощення вісь координат направимо вздовж напрямку поширення хвилі. Нехай точки джерела, що знаходиться при , коливаються за законом
.
До точки з координатою x (рис. 5.8) коливання прийдуть із запізненням на час
,
де v фазова швидкість поширення хвилі, тобто швидкість переміщення фази хвилі. Тоді рівняння коливання в точці х буде мати вигляд
.(5.46)
Це і є рівнянням плоскої хвилі, яке часто записують у формі
(5.47)
де хвильове число, довжина хвилі.
Довжина хвилі λ це шлях, який проходить хвиля за час, рівний періоду коливань, або відстань між найближчими точками, що коливаються в однаковій фазі (рис. 5.8). Відмітимо, що поняття плоскої хвилі передбачає постійність амплітуди, тобто нехтується поглинанням енергії середовищем.
Можна показати, що у випадку довільного напрямку поширення хвилі (наприклад, сферичної) рівняння хвилі має вигляд
, (5.49)
де хвильовий вектор, одиничний вектор нормалі до хвильової поверхні, радіус-вектор хвильової поверхні (, орти).
У комплексній формі рівняння хвилі (5.49) можна записати як
, (5.50)
де ; такий запис полегшує математичні перетворення.
§5.10. Хвильове рівняння
Хвильове рівняння це диференціальне рівняння, розвязком якого є рівняння хвилі. Для встановлення хвильового рівняння співставимо другі частинні похідні по координатах і часу від рівняння хвилі (5.50)
.
Тоді:
, (5.51)
(5.52)
Просумуємо систему рівнянь (5.52):
. (5.53)
Співставляючи (5.51) і (5.53), одержимо
. (5.54)
Оскільки
, (5.55)
то остаточно хвильове рівняння набуває вигляду
. (5.56)
Ліву частину цього рівняння можна лаконічно записати, використовуючи позначення оператора Лапласа як суму других частинних похідних по х, у, z від функції цих змінних. Тоді хвильове рівняння матиме вигляд
.
Для плоскої хвилі, що поширюється вздовж осі х, хвильове рівняння набуде вигляду
. (5.57)
Поширення коливань у пружному середовищі зумовлене поширенням деформації середовища під дією джерела хвилі. І тому швидкість поширення хвилі повинна визначатись пружними характеристиками середовища.
Зокрема, швидкість поздовжніх хвиль в твердих тілах
, (5.58)
в рідинах і газах
, (5.59)
де Е модуль Юнга, k модуль всебічного стиску.
Швидкість поперечних хвиль в твердих тілах
де G модуль зсуву.
Швидкість звуку в газах
де відношення молярних чи питомих теплоємностей при сталих тиску та обєму, універсальна газова постійна, Т термодинамічна температура, μ молярна маса газу.
§5.11. Енергія пружної хвилі
Енергія пружної хвилі складається з кінетичної енергії коливального руху частинок і потенціальної енергії, зумовленої деформацією. Виберемо елементарний циліндр пружного середовища ∆V настільки малим, щоб відносна деформація і швидкість у всіх точках обєму, відповідно, були однаковими. Тоді потенціальна енергія елементарного деформованого циліндра
. (5.60)
Оскільки у відповідності з (5.58)
,
то
. (5.61)
Кінетична енергія даного обєму ∆v буде
,
де маса обєму .
Повна енергія елемента обєму хвилі
,
а густина енергії енергія одиниці обєму
.(5.62)
Використавши рівняння плоскої хвилі
,
отримаємо
,
.
Підставляючи ці похідні в (5.62), отримаємо для густини енергії
. (5.63)
Із (5.63) видно, що густина енергії w в кожен момент часу у різних точках простору різна. В деякій точці х густина енергії змінюється з часом за законом квадрату синуса. Оскільки усереднене по часу значення квадрату синуса дорівнює , то середнє значення густини енергії в кожній точці буде
.
Потік енергії Ф це фізична величина, чисельно рівна енергії, яка переноситься хвилею за одиницю часу через деяку поверхню:
.
Під густиною потоку розуміють енергію, яка переноситься хвилею за одиницю часу через одиничну нормальну площадку, тобто
.
Енергія, яка переноситься через нормальну площадку ∆S за час ∆t, очевидно, рівна енергії, зосередженій в обємі циліндра висотою з основою ∆S (рис. 5.9), тобто
.
Тоді вектор густини потоку енергії , який називають вектором Умова, буде рівним
.
Середня енергія, що переноситься хвилею за одиницю часу через одиничну нормальну площадку, називається інтенсивністю хвилі І. Зрозуміло, що
,(5.65)
тобто інтенсивність хвилі пропорційна до квадрату амплітуди.
§5.12. Групова швидкість і дисперсія хвиль
Реальні хвильові (звукові) сигнали обмежені в просторі і являють собою хвильові пакети (рис. 5.10), які є суперпозицією багатьох гармонічних хвиль з різними довжинами хвиль. Оскільки енергія коливань пропорційна до квадрату амплітуди, то швидкість поширення енергії (сигналу) це швидкість поширення центру С хвильового пакету, де амплітуда максимальна. Ця швидкість називається груповою швидкістю хвилі u:
. (5.66)
Зрозуміло, що центр пакету формується з гармонічних хвиль, фази яких дуже близькі, тобто , а, значить, . Врахувавши, що , отримаємо
,
а звідси
. (5.67)
Оскільки фазова швидкість хвиль , то
, (5.68)
бо , а .
Залежність фазової швидкості від довжини хвилі називається дисперсією хвиль. При наявності дисперсії групова і фазова швидкості не співпадають.
§5.13. Стоячі хвилі
Якщо на біжучу хвилю
накладається відбита від перешкоди хвиля
,
то утворюється стояча хвиля. Рівняння стоячої хвилі можна отримати аналітичним додаванням:
(5.69)
З рівняння (5.69) видно, що стояча хвиля не «біжить», а її амплітуда залежить від координати x:
. (5.70)
Точки з максимальною амплітудою називаються пучностями, а точки з нульовою амплітудою вузлами (рис. 5.11).
Умовою пучності є
, (5.71)
що можливо, якщо , де Тоді координати пучностей
. (5.71)
Умовою вузлів є
,
що можливо, якщо
, де
Тоді координати вузлів
. (5.72)
Із (5.71) і (5.72) та з рис. 5.11 видно, що відстань між сусідніми пучностями і між сусідніми вузлами складає , а між сусіднім вузлом і пучністю . На перешкоді формується пучність або вузол, в залежності від величини хвильових опорів середовища і перешкоди. Якщо , як на рис. 5.11, то на перешкоді виникає вузол. Це зумовлене зміною фази відбитої хвилі на . Якщо ж , то зміна фази відсутня і на перешкоді пучність.
§5.14. Електромагнітні коливання
Електромагнітними коливаннями називаються процеси, при яких періодично змінюються з часом характеристики електричних і магнітних полів (заряд, сила струму, напруженість поля тощо). Джерелом електромагнітних коливань може бути коливальний контур, який складається з конденсатора ємністю С, котушки з індуктивністю L та резистора з опором R (рис. 5.12).
Нехай у початковий момент часу конденсатор зарядили до різниці потенціалів U, після чого джерело відєднали. Тоді по колу піде зростаючий розрядний струм. Коли потенціали обкладок конденсатора вирівняються, а в котушці індуктивності струм досягне максимального значення, е.р.с. самоіндукції в котушці підтримає спадаючий струм і відбудеться перезарядка конденсатора. Після цього знову виникне струм, але протилежного напрямку. Оскільки перезарядка конденсатора буде відбуватися періодично, то в контурі виникнуть електромагнітні коливання.
Такі коливання подібні до механічних, наприклад, до коливань маятника. Відхилений маятник за інерцією проходитиме положення рівноваги, відхиляючись у протилежну сторону, і продовжуватиме коливальний рух. Із такого порівняння видно, що індуктивність контура відіграє роль інерції, а опір роль сил тертя.
За ІІ правилом Кірхгофа алгебраїчна сума спадів напруг на ділянках контура рівна алгебраїчній сумі електрорушійних сил, що зустрічаються у контурі:
. (5.73)
Оскільки , а , то (5.73) можна переписати як
або
,
чи
. (5.74)
Ввівши позначення
,
отримаємо диференціальне рівняння коливань заряду на пластинах конденсатора
,
де власна циклічна частота коливань, коефіцієнт згасання.
За аналогією з механічними коливаннями розвязок цього рівняння має вигляд
, (5.75)
де циклічна частота згасаючих коливань рівна
або
.
Величина
є амплітудою згасаючих коливань. Використавши (5.75), можна встановити вирази для коливань напруги на конденсаторі і сили струму в контурі . Період електромагнітних згасаючих коливань
.
Якщо опір (ідеальний контур), то в контурі встановляться незгасаючі коливання величин з періодом
. (5.76)
Вираз (5.76) називають формулою Томсона для гармонічних електромагнітних коливань. Відмітимо, що коливання струму зміщені в ідеальному контурі по фазі на порівняно з коливанням заряду і напруги, оскільки .
§5.15. Вимушені електромагнітні коливання
Якщо в коливальному контурі з ємністю С, індуктивністю L, опором R є періодично діюча змушувальна електрорушійна сила
,
то в такому контурі існуватимуть вимушені електромагнітні коливання.
За ІІ правилом Кірхгофа маємо
. (5.77)
Виразивши відповідні величини через заряд, отримаємо
або
, (5.78)
чи
. (5.79)
Співвідношення (5.78) або (5.79) є диференціальними рівняннями вимушених електромагнітних коливань.
Ввівши позначення
,
рівняння (5.79) перепишемо у вигляді
. (5.80)
Розвязок цього рівняння для віддалених моментів часу (див. §5.8) запишемо у вигляді
. (5.81)
Отже, вимушені електромагнітні коливання незгасаючі і здійснюються з частотою і амплітудою, яка залежить від параметрів контура і цієї частоти:
.
Початкова фаза α рівна
.
Зрозуміло, що в такому контурі буде мати місце резонанс як заряду, так і напруги і струму, коли вимушуюча частота наближається до власної .
З (5.81) можна отримати значення сили струму в контурі
або
,
де
. (5.82)
Ця формула має зміст закону Ома для кола змінного струму (при послідовному зєднанні елементів), де повний опір кола
є векторною сумою активного опору R, індуктивного опору ωL та ємнісного опору . Зрозуміло, що резонанс буде мати місце при рівності індуктивного та ємнісного опорів.
§5.16. Електромагнітні хвилі. Шкала електромагнітних хвиль
Електромагнітні хвилі це процес поширення електромагнітних коливань у просторі. Джерелом електромагнітних хвиль може бути відкритий коливальний контур. Вперше електромагнітні хвилі були експериментально вивчені Герцем у 1888 році.
У закритому коливальному контурі коливання електричного поля, в основному, зосереджені між обкладками конденсатора, а магнітного поля в котушці індуктивності. Коливання в такому контурі підтримується шляхом підведення енергії до обкладок конденсатора від джерела змінної електрорушійної сили. Щоб сумістити в просторі коливання електричного і магнітного полів, необхідно перейти до вібратора Герца (рис. 5.13). Коли різниця потенціалів між кульками досягає значної величини і між ними проскакує іскра, у просторі навколо вібратора встановлюються електромагнітні коливання.
Відомо (розділ 4), що електромагнітне поле описується системою рівнянь Максвелла. Розвязуючи ці рівняння для випадку непровідного середовища і відсутності вільних зарядів , отримаємо:
. (5.83)
Система (5.83), якщо порівняти її з рівнянням (5.56), є системою хвильових рівнянь для електричної і магнітної складових електромагнітного поля. Таким чином, електромагнітне поле не може бути локалізоване в точці, а поширюється в навколишньому середовищі у вигляді електромагнітних хвиль. З порівняння (5.83) і (5.56) отримаємо для фазової швидкості поширення електромагнітної хвилі
,
де м/с швидкість поширення цих хвиль у вакуумі .
Співпадання значення с зі швидкістю світла у вакуумі дозволило Максвеллу стверджувати, що світло є електромагнітною хвилею.
Для плоскої електромагнітної хвилі, що поширюється вздовж осі x, система (5.83) набуває вигляду:
,
.
Розвязуючи цю систему, отримаємо рівняння плоскої електромагнітної хвилі (рис. 5.14)
.(5.84)
Видно, що електромагнітна хвиля поперечна, при цьому напрямки коливань та взаємноперпендикулярні.
Електромагнітні хвилі мають широкий діапазон довжин хвиль або частот, які залежать від способу їх генерації; зокрема, радіохвилі мають довжини , для інфрачервоних, світлових, ультрафіолетових: , для рентгенівського і -випромінювання: . Радіохвилі генеруються вібраторами; світлові та рентгенівські хвилі молекулами і атомами; -промені ядрами.
§5.17. Енергія електромагнітних хвиль. Вектор Умова-Пойнтінга
Перенос енергії електромагнітною хвилею описується вектором Умова-Пойтінга, який є аналогом вектора Умова для механічних хвиль, тобто це вектор густини потоку електромагнітної хвилі:
. (5.85)
Обємну густину енергії знайдемо як суму обємних густин електричної і магнітної складових:
. (5.86)
З розвязку рівнянь Максвелла випливає наступне співвідношення
. (5.87)
Обєднавши (5.86) та (5.87), отримаємо
, (5.88)
а з урахуванням (5.85):
. (5.89)
Інтенсивність електромагнітної хвилі
,
оскільки .
Враховуючи (5.84), отримаємо:
.(5.90)
Оскільки співвідношення (5.87) виконується і для амплітудних значень E і H, то
Таким чином, інтенсивність електромагнітної хвилі пропорційна до квадрату амплітуди напруженості електричного (магнітного) поля хвилі.
Світло, як предмет оптики, має подвійну природу. З одного боку, це електромагнітна хвиля, а з іншого, потік квантів, фотонів. І тому одні оптичні явища інтерференція, дифракція, поляризація, дисперсія світла є предметом хвильової (класичної) оптики, а інші теплове випромінювання, фотоефект, тиск світла, ефект Комптона тощо є предметом квантової оптики. Як окремий розділ слід виділити геометричну оптику, яка ґрунтується на принципі прямолінійності поширення світла в однорідних середовищах.
§6.1. Елементи геометричної оптики: закони відбивання і заломлення світла; тонкі лінзи
6.1.1. В основі геометричної оптики лежать закони відбивання і заломлення світла. Закон відбивання твердить, що відбитий промінь лежить в одній площині з падаючим променем і нормаллю N, проведеною в точці падіння; при цьому кут відбивання дорівнює куту падіння . Закон заломлення: промінь падаючий, заломлений і нормаль в точці падіння лежать в одній площині; відношення синуса кута падіння до синуса кута заломлення є величина стала для даної пари двох середовищ і рівна відносному показнику заломлення другого середовища відносно першого (рис.6.1):
. (6.1)
Відносний показник заломлення це відношення абсолютних показників заломлення середовищ і , де (с швидкість світла у вакуумі, і швидкості світла в першому і другому середовищах).
Отже,
(6.2)
Якщо промінь поширюється з оптично більш густого середовища в менш густе , то при деякому граничному куті падіння заломлений промінь буде ковзати вздовж межі поділу двох середовищ, тобто . При куті падіння світловий промінь повністю відбивається. В цьому полягає суть явища повного внутрішнього відбивання (рис.6.2). Очевидно, в цьому випадку
(6.3)
На явищі повного внутрішнього відбивання базується робота приладів (рефрактометрів), які дозволяють визначати показник заломлення середовища.
6.1.2. Лінза називається тонкою, якщо її товщина d мала порівняно з радіусами кривизни її поверхонь і (рис. 6.3). Головною оптичною віссю лінзи називають пряму, що проходить через центри кривизни її поверхонь. Можна вважати, що в такій лінзі точки перетину головної оптичної осі з обома поверхнями лінзи співпадають. Цю точку називають центром лінзи. Промені, які проходять через центр лінзи, не зазнають заломлень.
Величину
(6.4)
називають оптичною силою тонкої лінзи і абсолютні показники заломлення матеріалу лінзи і оточуючого середовища). Для збірної (додатної) лінзи Ф>0, для розсівної (відємної) Ф<0. Точки, що лежать на головній оптичній осі лінзи по обидві сторони від оптичного центру на відстанях f, , називають головними фокусами лінзи (рис. 6.4): .
Для першого головного фокуса F
(6.5)
Аналогічно, друга головна фокусна відстань
(6.6)
Площини, які проходять через головні фокуси F і лінзи перпендикулярно до головної оптичної осі, називаються фокальними площинами лінзи.
Найчастіше буває, що речовина по обидва боки від лінзи одна й та ж (наприклад, повітря). Тоді головні фокусні відстані чисельно дорівнюють одна одній. Протилежні знаки означають, що головні фокуси лежать з різних боків від лінзи. Для збірної лінзи (оскільки Ф>0) , для розсівної лінзи (оскільки Ф<0)
Для лінз справедливе основне рівняння
, (6.7)
де всі відрізки відраховуються від центру лінзи, а радіуси кривизни завжди напрямлені від вершини поверхні до центру її кривизни. Вони вважаються додатними, якщо напрямлені в сторону поширення світла. Відрізки, перпендикулярні до оптичної осі, відраховуються від оптичної осі; вони додатні вище оптичної осі і відємні нижче оптичної осі.
При розвязуванні задач основне рівняння тонкої лінзи (6.7) записують у вигляді
, (6.8)
де , , знак плюс відповідає збірній лінзі, знак мінус розсівній.
Лінійне збільшення тонкої лінзи визначається як
(6.9)
Для дійсних зображень Г < 0, тобто вони обернені; для уявних зображень Г>0, тобто вони прямі.
Оптична сила Ф центрованої системи двох тонких лінз з оптичними силами Ф1 і Ф2 на відстані d одна від одної дорівнює
(6.10)
§6.2. Монохроматичні світлові хвилі
У відповідності з електромагнітною теорією (розділ 5) плоска світлова хвиля, що поширюється вздовж напрямку , описується системою рівнянь для електричної та магнітної складових хвилі:
, (6.11)
де відповідні амплітуди, циклічна частота хвилі, хвильове число ( довжина хвилі), початкова фаза.
В більшості оптичних явищ дія світла на речовину визначається електричним вектором електромагнітного поля. Світлове випромінювання (Гц) не призводить до намагнічування середовища. Тому, саме вектор називають світловим вектором, а перше рівняння системи (6.11) називають рівнянням плоскої світлової хвилі.
Світлова хвиля називається монохроматичною, якщо амплітуда , частота , а початок і кінець хвилі жодним чином не обмежені, тобто . Однак, оскільки тривалість процесу випромінювання електромагнітних хвиль окремими атомами є скінченною , то світло є сукупністю просторово обмежених хвиль (цугів). В подальшому, як правило, будемо оперувати поняттям монохроматичних світлових хвиль.
Якщо дві монохроматичні хвилі однакової частоти накладаються в певній точці простору, то їх різниця фаз
за рахунок випадковості і непередбачуваності початкових фаз не буде залишатись постійною в часі. Якщо ж обидві хвилі мають спільне походження , то . Хвилі однакової частоти, що мають постійну в часі різницю фаз, називають когерентними. Якщо врахувати, що хвильове число
,
де n показник заломлення середовища, в якому поширюється хвиля, а довжина світлової хвилі у вакуумі, то
.
Тут оптична різниця ходу когерентних світлових хвиль (променів), оскільки добуток називається оптичним шляхом променя. Зрозуміло, що для когерентних світлових хвиль оптична різниця ходу не залежить від часу.
§6.3. Інтерференція світла
Інтерференція світла це явище накладання когерентних світлових хвиль, в результаті якого відбувається перерозподіл світлової енергії в просторі. В точках простору, куди когерентні хвилі приходять у фазі, вони підсилюють одна одну; в точках, куди вони попадають у протифазі, відбувається послаблення світла. На екрані спостерігається характерна інтерференційна картина у вигляді чергування темних і світлих смуг максимумів і мінімумів освітленості, якщо падаюче світло монохроматичне. Відмітимо, що сказане має місце лише тоді, коли напрямки коливань світлового вектора обох хвиль співпадають.
У випадку максимуму інтенсивності інтерференційної картини в оптичній різниці ходу двох когерентних хвиль вкладається ціле число довжин хвиль (у вакуумі) , тобто
. (6.12)
Мінімум інтерференції спостерігається, коли в оптичній різниці ходу вкладається непарне число півхвиль, тобто
. (6.13)
Когерентні хвилі отримують двома способами: поділом фронту хвилі та поділом амплітуди хвилі. До поділу фронту хвилі можна віднести такі схеми утворення когерентних хвиль: дослід Юнга, дзеркала Френеля, біпризма Френеля.
У досліді Юнга світло від точкового монохроматичного джерела S падає на два невеликих отвори та в екрані А, розміщені на рівних відстанях від джерела S (рис. 6.5). Ці отвори діють як вторинні монохроматичні точкові синфазні джерела. Поділений таким чином фронт хвилі дозволяє спостерігати інтерференційну картину в області перекриття світлових пучків від джерел та .
У методі дзеркал Френеля використовують два плоскі дзеркала і (рис. 6.6), кут між якими дуже малий. Світло від точкового джерела S, внаслідок відбивання від обох дзеркал утворює два уявних зображення і , які діють як когерентні джерела. Хвилі від цих джерел накладаються і дають на екрані Е інтерференційну картину.
В іншому методі спостереження інтерференції використовують біпризму Френеля, яка складається з двох однакових скляних призм з невеликим заломлюючим кутом (рис. 6.7). Світло від джерела S заломлюючись в призмі, ділиться на дві хвилі, які відповідають когерентним уявним джерелам і . Розрахунок інтерференційної картини на екрані, яку дістають за допомогою біпризми Френеля або дзеркал Френеля, нічим не відрізняється від приведеного нижче розрахунку для досліду Юнга.
Розглянемо дві когерентні світлові хвилі, що йдуть від джерел i ; d відстань між джерелами (рис. 6.8). На екрані Е внаслідок інтерференції спостерігається інтерференційна картина у вигляді світлих і темних смуг. Обчислимо ширину цих смуг припускаючи, що пряма паралельна до площини екрану. Позначимо координати інтерференційного максимуму чи мінімуму як . З трикутника S2PD2 маємо
,
а з трикутника S1PD1
.
Звідси і тому . З умов і випливає, що Отже, координата повязана з оптичною різницею ходу співвідношенням
. (6.14)
З врахуванням умов (6.12, 6.13), отримаємо координати максимумів
(6.15)
та мінімумів інтенсивності світла
(6.16)
Відстань між двома сусідніми мінімумами інтенсивності визначає ширину інтерференційної смуги. Згідно з (6.15) і (6.16),
(6.17)
Очевидно, що відстань між інтерференційними максимумами (відстань між смугами) буде така ж сама. З (6.17) видно, що відстань зростає при зменшенні відстані d між джерелами S1 i S2. Інтерференційна картина буде чіткою при умові Вимірюючи і , можна експериментально визначити довжину світлової хвилі.
§6.4. Інтерференція світла на тонких плівках
6.4.1. При падінні світлової хвилі на тонку прозору плівку або пластину має місце відбивання від обох поверхонь плівки. В результаті виникають когерентні світлові хвилі, які зумовлюють інтерференцію світла.
Нехай на прозору плоскопаралельну плівку з показником заломлення n і товщиною d під кутом і падає плоска монохроматична хвиля (рис. 6.9). Падаюча хвиля частково відбивається від верхньої поверхні плівки (промінь 1). Заломлена хвиля, частково відбившись від нижньої поверхні плівки, на верхній поверхні знову частково відбивається, а заломлена хвиля (промінь 2) накладається на першу відбиту хвилю (промінь 1). Паралельні промені 1 і 2 когерентні між собою, вони дають локалізовану на нескінченності інтерференційну картину, яка визначається оптичною різницею ходу
(6.18)
Надалі будемо вважати показник заломлення середовища n0 рівним одиниці. Доданок зумовлений втратою півхвилі при відбиванні світла від більш густого середовища. При цьому фаза коливань світлового вектора змінюється на π. При відбиванні світлової хвилі менш густим середовищем (відбивання в точці С) такої зміни фази не відбувається.
З рис. 6.9 видно, що , .
Згідно із законом заломлення , тому .
Підставляючи ОС, СВ, і ОА в (6.18), отримаємо для оптичної різниці ходу вираз
,
або через кут падіння
.
На екрані (при використанні збирної лінзи) буде спостерігатись максимум, якщо
, (6.19)
і мінімум, якщо
. (6.20)
Оптична різниця ходу для прохідного світла відрізняється від оптичної різниці ходу для відбитого світла на , бо прохідне світло не відбивається від оптично густішого середовища. Таким чином, максимумам інтерференції у відбитому світлі відповідають мінімуми інтерференції в прохідному світлі, і навпаки.
Інтерференція монохроматичного світла на плоскопаралельній пластинці визначається величинами , d, n, та і. Різним кутам падіння і відповідають різні точки інтерференційної картини (смуги). Інтерференційні смуги, які виникають внаслідок накладання хвиль, що падають на плоскопаралельну пластину під однаковими кутами, називають смугами однакового нахилу. Паралельні промені 1 і 2 (рис. 6.9) сходяться в нескінченості, тому кажуть, що смуги однакового нахилу локалізовані на нескінченості. Для їх спостереження використовують збирну лінзу і екран, розміщений у фокальній площині лінзи.
6.4.2. Розглянемо інтерференцію світла на клиноподібній плівці змінної товщини. Нехай на клин з кутом між боковими гранями падає плоска хвиля (промені 1, 2 на рис. 6.10). Очевидно, що відбиті промені 1 і 1 від верхньої та нижньої поверхонь клина (так само як 2 і 2) когерентні між собою. Вони можуть інтерферувати. Якщо кут α малий, то оптична різниця ходу променів 1 і 1 визначається формулою
, (6.21)
де середня товщина клина на ділянці АС. З рис. 6.10 видно, що інтерференційна картина локалізована біля поверхні клина. Система інтерференційних смуг виникає за рахунок відбивання від місць плівки, що мають однакову товщину. Ці смуги називаються смугами однакової товщини. Користуючись (6.21), можна визначити відстань Δу між двома сусідніми максимумами для випадку монохроматичного світла, нормального падіння променів і малого кута :
Окремим випадком смуг однакової товщини є кільця Ньютона, що виникають у повітряному прошарку між плоскоопуклою лінзою великого радіуса кривизни R і плоскою скляною пластиною, які дотикаються в точці Р (рис. 6.11). При накладанні відбитих хвиль виникають інтерференційні смуги однакової товщини, що мають при нормальному падінні світла вигляд концентричних кілець. В центрі картини міститься інтерференційний мінімум нульового порядку. Це зумовлено тим, що в точці Р різниця ходу між когерентними променями визначається лише втратою півхвилі при відбиванні від поверхні пластини. Геометричним місцем точок однакової товщини повітряного прошарку між лінзою і пластиною є коло, тому інтерференційна картина спостерігається у вигляді концентричних темних і світлих кілець. У прохідному світлі спостерігається доповнююча картина центральне коло світле, наступне кільце темне і т. д.
Знайдемо радіуси світлих і темних кілець. Нехай d товщина повітряного прошарку на відстані r від точки Р. Оптична різниця ходу Δ між променем, який відбився від пластини, і променем, який зазнав відбивання на межі поділу опукла поверхня лінзи повітря, дорівнює
де доданок враховує втрату півхвилі при відбиванні від більш густого середовища.
З трикутника ODE маємо
При d << R
Тоді оптична різниця ходу променів
Використовуючи умову максимуму (), знайдемо радіус світлого mго кільця
(6.22)
Радіус m-го темного кільця
(6.23)
Очевидно, що в прохідному світлі формули (6.22) і (6.23) міняються місцями. Експериментальні вимірювання радіусів кілець Ньютона дозволяють розрахувати за цими формулами радіус плоскоопуклої лінзи R. Вивчаючи кільця Ньютона в цілому, можна давати оцінку якості обробки поверхонь лінзи та пластини. Слід зауважити, що при спостереженні інтерференції в білому світлі інтерференційна картина набуває райдужного забарвлення.
6.4.3. Явище інтерференції світла лежить в основі роботи численних оптичних приладів інтерферометрів, за допомогою яких з великою точністю вимірюють довжину світлових хвиль, лінійні розміри тіл та їх зміну, а також вимірюють показники заломлення речовин.
Зокрема, на рис. 6.12 зображена схема інтерферометра Майкельсона. Світло від джерела S падає під кутом 45 на напівпрозору пластину Р1. Половина падаючого пучка світла відбивається в напрямку променя 1, половина проходить
крізь пластину в напрямку променя 2. Пучок 1 відбивається дзеркалом М1 і, повертаючись назад, знову проходить через пластину Р1 (). Пучок світла 2 йде до дзеркала М2, відбивається від нього і, відбившись від пластини Р1, йде в напрямку променя 2. Оскільки промінь 1 проходить крізь пластину Р1 тричі, а промінь 2 лише один раз, то для компенсації різниці ходу на шляху променя 2 ставиться пластина Р2 (така ж сама як і Р1, але без напівпрозорого покриття).
Промені 1 і 2 когерентні і тому буде спостерігатися інтерференція. Оптична різниця ходу між ними
,
де n показник заломлення середовища, а і відстані від точки О до дзеркал М1 та М2.
Інтерференційна картина залежить від положення дзеркал і геометрії пучка світла, який падає на прилад. Якщо падаючий пучок паралельний, а площини дзеркал М1 і М2 майже перпендикулярні, то в полі зору спостерігаються інтерференційні смуги рівної товщини. Зміщення картинки на одну смугу відповідає зміщенню одного із дзеркал на відстань Таким чином, інтерферометр Майкельсона використовується для точних вимірювань довжини. Абсолютна похибка при таких вимірюваннях складає 10-11 (м). Інтерферометр Майкельсона також можна використати для вимірювання малих змін показників заломлення прозорих тіл в залежності від тиску, температури, домішок.
О.Смакула розробив спосіб просвітлення оптичних пристроїв для зменшення втрат світла, зумовлених його відбиванням від заломних поверхонь. У складних обєктивах число відбивань велике, тому втрати світлового потоку досить значні. Щоб елементи оптичних систем зробити просвітленими, їх поверхні покривають прозорими плівками, показник заломлення яких менший, ніж скла. При відбиванні світла на межі поділу повітря-плівка і плівка-скло виникає інтерференція відбитих хвиль. Товщину плівки d і показники заломлення скла nc та плівки n підбирають так, щоб відбиті хвилі гасили одна одну. Для цього їх амплітуди повинні бути рівними, а оптична різниця ходу відповідати умові мінімуму. Амплітуди відбитих хвиль будуть рівними при . Умова мінімуму при нормальному падінні світла має вигляд
Для мінімальної товщини (m = 0)
Отже, при товщині плівки і показнику заломлення плівки спостерігається гасіння відбитих хвиль. В цьому суть просвітлення оптики.
§6.5. Дифракція світла. Принцип Гюйгенса - Френеля. Метод зон Френеля
6.5.1. Дифракція світла це сукупність явищ, які зумовлені хвильовою природою світла і спостерігаються в середовищах з різкими неоднорідностями (наприклад, при проходженні світла через отвори, поблизу границь непрозорих тіл і т.п.). Дифракція, зокрема, приводить до огинання світловими хвилями перешкод і проникання світла в область геометричної тіні. Для спостереження дифракції необхідно, щоб розміри перешкод були співмірні з довжиною хвилі світла.
Проникнення світла в область геометричної тіні пояснює принцип Гюйгенса: кожна точка фронту хвилі є джерелом вторинної сферичної хвилі; положення фронту хвилі в наступний момент визначається огинаючою фронтів усіх вторинних хвиль. Принцип Гюйгенса не дозволяє знайти інтенсивність дифрагованої хвилі. Цей недолік усунув Френель, який доповнив принцип Гюйгенса уявленням про інтерференцію вторинних хвиль.
Нехай S (рис.6.13) хвильова поверхня світла, яке поширюється від деякого джерела. Кожен елемент поверхні служить джерелом вторинної хвилі. При цьому вважатиметься, що вторинні хвилі від усіх елементів когерентні. Від кожного елемента поверхні dS в точку Р приходить коливання
(6.24)
Тут амплітуда і фаза коливання в місці знаходження хвильової поверхні S, k хвильове число, r відстань від елемента dS до точки Р. Коефіцієнт залежить від орієнтації елемента dS відносно r. Результуюче коливання в точці Р, згідно з Френелем, є суперпозицією коливань усієї хвильової поверхні S:
. (6.25)
Формула (6.25) є аналітичним виразом принципу Гюйгенса-Френеля.
6.5.2. В ряді дифракційних задач, що мають осьову симетрію, розрахунок інтерференції вторинних хвиль спрощується за допомогою розбиття фронту хвилі на кільцеві зони Френеля. Розбиття на зони проводиться таким чином, що оптична різниця ходу від відповідних точок кожної пари сусідніх зон до точки спостереження Р дорівнює . Вторинні хвилі від відповідних точок двох сусідніх зон приходять в точку Р у протифазі і послаблюють одна одну при накладанні (рис.6.14).
Нехай величини результуючих амплітуд хвиль, які приходять в точку Р від кожної зони. Сумарна амплітуда в точці Р від усього фронту буде дорівнювати
(6.26)
де відповідає непарному числу зон, а знак “” парному.
За рахунок збільшення кута нахилу з ростом номера зони і відстані до точки Р, амплітуди хвиль монотонно зменшуються Можна вважати, що
(6.27)
Тепер результуючу амплітуду А можна записати у вигляді
Очевидно, що вирази в дужках дорівнюють практично нулю; тоді
(6.28)
для парного числа зон Френеля. Результуюча амплітуда при цьому мінімальна, і в точці Р буде мінімум освітленості. Якщо ж N непарне, то
, (6.29)
і в точці Р спостерігається максимум освітленості. Для повністю відкритої хвильової поверхні і , тому , тобто дія всієї хвильової поверхні еквівалентна дії половини центральної зони Френеля.
Якщо дифракція світла відбувається на круглому непрозорому диску, який закриває N перших зон Френеля, то результуюча амплітуда в точці Р буде визначатися величиною
. (6.30)
Дифракційна картина у цьому випадку має вигляд концентричних світлих і темних кілець. В центрі картини при довільному N (парному чи непарному) спостерігається світла пляма (пляма Пуасона). При збільшенні розмірів диску величина амплітуди буде зменшуватись. Врешті-решт при досить великих розмірах диску і . При цьому в точці Р буде темна пляма геометрична тінь.
Таким чином, закони геометричної оптики можна застосовувати у тих випадках, коли розміри перешкод і отворів великі порівняно з довжиною хвилі світла.
§6.6. Дифракція Фраунгофера
Дифракцією Фраунгофера називається дифракція плоских хвиль (паралельних променів). Дифракція Фраунгофера має більше практичне значення, ніж дифракція Френеля (дифракція сферичних хвиль).
Розглянемо довгу прямокутну щілину BС шириною a, на яку нормально падає паралельний пучок монохроматичного світла (рис.6.15). Згідно з принципом Гюйгенса-Френеля, точки щілини є когерентними вторинними джерелами, що породжують коливання в одній фазі (площина щілини співпадає з фронтом хвилі).
За допомогою лінзи Л на екрані Е спостерігається дифракційна картина, яка є системою максимумів і мінімумів. Знайдемо умови спостереження максимумів і мінімумів. Для цього розібємо фронт хвилі ВС на зони Френеля таким чином, щоб оптична різниця ходу від країв сусідніх зон у певному напрямку поширення дифрагованої хвилі під кутом дифракції складала половину довжини хвилі . З рис.6.15 видно, що ширина зони Френеля дорівнює . Якщо число зон парне, то
(6.31)
і під кутом спостерігається дифракційний мінімум. Коливання від відповідних точок сусідніх зон у точці спостереження відбуваються у протифазі, тому випромінювання від сусідніх зон в цілому взаємно компенсуються.
Якщо число зон непарне, то
(6.32)
то спостерігається дифракційний максимум, який відповідає дії однієї нескомпенсованої зони Френеля. Величина m називається порядком дифракційного максимуму (мінімуму).
Амплітуда хвилі в точці спостереження одержується на основі принципу Гюйгенса-Френеля:
(6.33)
де амплітуда в центрі дифракційної картини при .
Розподіл інтенсивностей :
(6.34)
Цей розподіл показаний на рис. 6.16.
Перейдемо до дифракції на одновимірній дифракційній решітці, що є системою N однакових паралельних щілин шириною а, розміщених на однакових відстанях b. Величина називається періодом решітки. Сучасна дифракційна решітка має 1200 і більше щілин (штрихів) на 1мм.
Дифракційна картина після решітки складніша порівняно з картиною від однієї щілини. Це зумовлене тим, що відбувається інтерференція хвиль, які йдуть від різних щілин решітки, тому має місце підсилення максимумів і їх звуження.
Якщо світло падає нормально на решітку, то виконуються такі умови:
для головних максимумів: ; (6.35)
для головних мінімумів: ; (6.36)
для додаткових мінімумів: (6.37)
(kдовільні цілі додатні числа, крім 0, N, 2N, 3N, …).
Розподіл інтенсивності на екрані спостереження:
(6.38)
де інтенсивність в напрямку для однієї щілини. В головних максимумах інтенсивність світла в разів більша від інтенсивності відповідних максимумів дифракційної картини від однієї щілини. При великому значенні N вторинні максимуми майже непомітні на екрані, їх інтенсивність не більша 5% від інтенсивності головного максимуму.
На рис.6.17 показана дифракційна картина після дифракційної решітки в білому світлі (вторинні максимуми не зображені). З умови головних максимумів випливає, що для всіх порядків, крім m = 0, біле світло розкладається в спектр. Тому дифракційна решітка використовується як диспергуючий елемент в спектрометрах.
Важливою характеристикою оптичних приладів є їхня роздільна здатність. Згідно з критерієм Релея, зображення двох близьких точок можна вважати розділеними, якщо центральний дифракційний максимум від однієї точки співпадає з першим дифракційним мінімумом для другої точки.
Для круглого отвору роздільна здатність
(6.39)
де D діаметр отвору, довжина хвилі світла.
Мірою роздільної здатності дифракційної решітки (спектрального приладу) прийнято вважати відношення довжини хвилі , біля якої виконується вимірювання, до мінімального розділеного інтервалу , тобто Користуючись критерієм Релея, можна показати, що
(6.40)
де m порядок спектру, N кількість щілин дифракційної решітки.
§6.7. Дифракція рентгенівських променів
Відстань між атомами в кристалі (10-10м) співмірна з довжиною хвилі рентгенівського випромінювання, тому кристалічна решітка може служити просторовою дифракційною решіткою для рентгенівських променів. Якщо на кристал спрямувати потік рентгенівського випромінювання від рентгенівської трубки з неперервним спектром, то для даного кристалу знайдуться промені з такою довжиною хвилі , що умови дифракції будуть виконуватись.
Розрахунок дифракційної картини від кристалічної решітки можна провести наступним простим способом. Проведемо через вузли кристалічної решітки паралельні рівновіддалені площини (атомні площини). Якщо падаюча на кристал хвиля плоска, то і огинаюча вторинних хвиль, які породжені атомами даного атомного шару, також буде площиною. Плоскі вторинні хвилі, відбиті від різних атомних площин, когерентні і будуть давати інтерференційну картину. При цьому, як і у випадку дифракційної решітки, вторинні хвилі будуть практично гасити одна одну у всіх напрямках, крім тих, для яких різниця ходу між сусідніми хвилями буде кратною .
З рис. 6.18 видно, що різниця ходу для хвиль, які відбились від сусідніх атомних площин, дорівнює 2dsin, де d період кристалічної решітки, кут ковзання падаючих променів. Напрямки, в яких спостерігаються дифракційні максимуми, визначаються умовою Вульфа-Брега
. (6.41)
Наявність багатьох атомних площин призводить лише до того, що максимуми інтенсивностей стають більш гострими, як і при збільшенні числа щілин дифракційної решітки.
Дифракція рентгенівських променів від кристалів має два основних практичних застосування. Вона використовується для визначення спектрального складу рентгенівського випромінювання (рентгенівська спектроскопія). Визначаючи напрямки дифракційних максимумів досліджуваного рентгенівського випромінювання від кристалів з відомою структурою, можна обчислити (за формулою 6.41) довжини хвиль.
Друге практичне використання вивчення структури кристалів (рентгеноструктурний аналіз). У цьому випадку за відомим спектральним складом падаючого випромінювання знаходять міжатомні відстані в кристалі. Існують різні методики рентгеноструктурного аналізу (метод Лауе, метод Дебая).
§6.8. Поляризація світла. Типи і способи поляризації
6.8.1. Світлова хвиля складається з багатьох цугів електромагнітних хвиль, що випромінюються окремими атомами. Площина коливань (площина коливань світлового вектора ) для кожного цугу орієнтована випадково. Тому в природному світлі коливання різних напрямків швидко і хаотично змінюють одне одного. Світло, в якому напрямки коливань якимось чином впорядковані, називається поляризованим. Якщо коливання світлового вектора відбувається в одній площині, світло називають плоско- (або лінійно-) поляризованим. Площину, перпендикулярну до площини коливань, називають площиною поляризації (рис.6.19).
Якщо кінець світлового вектора описує еліпс, то світло називається еліптично-поляризованим. Таке світло можна представити як суму двох когерентних плоскополяризованих хвиль, площини коливань яких взаємно перпендикулярні. Проекції світлових векторів на відповідні осі змінюються по закону
. (6.42)
При різниці фаз еліпс вироджується в пряму маємо плоскополяризоване світло. При різниці фаз і рівності амплітуд еліпс перетворюється в коло. В цьому випадку маємо циркулярно-поляризоване світло (колова поляризація). В залежності від напрямку обертання світлового вектора розрізняють праву і ліву еліптичну і колову поляризації.
Плоскополяризоване світло можна отримати з природного за допомогою поляризаторів. Ці прилади вільно пропускають коливання, паралельні до площини поляризатора і повністю затримують коливання, перпендикулярні до цієї площини.
Нехай на поляризатор падає плоскополяризоване світло з амплітудою і інтенсивністю (мал.6.20). Крізь прилад пройде складова коливання з амплітудою де кут між площиною коливань падаючого світла і площиною поляризатора. Інтенсивність світла, що пройшло через поляризатор,
. (6.43)
Це співвідношення носить назву закону Малюса.
Поляризоване світло можна також отримати при відбиванні світла на межі поділу двох середовищ. При куті падіння, який задовольняє умові
(6.44)
(закон Брюстера) відбитий промінь повністю поляризований. Коливання у відбитому промені відбуваються у площині, перпендикулярній до площини падіння. Ступінь поляризації заломленого променя при куті падіння максимальний, однак цей промінь лишається поляризованим лише частково (рис.6.21).
6.8.2. При проходженні світла через анізотропні кристали відбувається явище подвійного променезаломлення. Падаючий на кристал природний промінь ділиться на два плоскополяризовані звичайний (0) і незвичайний (е) (рис. 6.22). Звичайний промінь підкоряється закону заломлення, незвичайний ні; для нього показник заломлення різний в різних напрямках.
В кожному анізотропному кристалі існує напрямок (або два), вздовж якого подвійне променезаломлення не відбувається, а звичайний і незвичайний промені поширюються з однаковою швидкістю. Такий напрямок називається оптичною віссю кристалу. Існують одноосні кристали (кварц, ісландський шпат) і двоосні (слюда, гіпс). Довільна площина, яка проходить через оптичну вісь, називається головною площиною кристалу. На рис.6.22 оптична вісь, тому площина малюнку є головною площиною. Якщо напрямок променя співпадає з оптичною віссю, то подвійного променезаломлення немає.
Подвійне променезаломлення лежить в основі роботи поляризаторів: поляризаційних призм і поляроїдів. Поляризаційна призма Ніколя (ніколь) являє собою призму з ісландського шпату, розрізану по діагоналі і склеєну канадським бальзамом. Показник заломлення канадського бальзаму n лежить між показниками заломлення і звичайного і незвичайного променів в кристалі . Кут падіння такий, що звичайний промінь зазнає на прошарку клею повного внутрішнього відбивання і не проходить крізь призму. З рис.6.23 видно, що призма Ніколя пропускає лише незвичайний лінійнополяризований промінь.
В деяких кристалах один з променів поглинається сильніше іншого. Це явище називається дихроїзмом. Так, наприклад, в кристалі турмаліну звичайний промінь на довжині 1мм поглинається практично повністю. Таку ж властивість має целулоїдна плівкаполяроїд, в яку введена велика кількість однаково орієнтованих кристалів сульфату йодистого хініну.
§6.9. Інтерференція поляризованих променів. Обертання площини поляризації
6.9.1. Звичайна і незвичайна хвилі, які поширюються в одноосному кристалі при падінні на нього природного світла, некогерентні. Якщо ж на одноосний кристал падає лінійнополяризоване світло, то звичайна і незвичайна хвилі в кристалі будуть когерентними. Нехай плоскопаралельна пластинка, яка вирізана з одноосного кристалу паралельно його оптичній осі, розміщена між двома ніколями (рис.6.24). На виході з пластинки між звичайною і незвичайною хвилями виникає різниця фаз
. (6.45)
Хоча ці хвилі після пластинки когерентні, однак вони не можуть давати інтерференцію через те, що вони поляризовані у взаємно перпендикулярних площинах. Для спостереження інтерференції цих хвиль необхідно за допомогою аналізатора виділити з них складові, які поляризовані в одній площині і тому здатні інтерферувати. Таким чином, якщо , спостерігається максимум інтенсивності поляризованого світла. Якщо , спостерігається мінімум інтенсивності поляризованого світла.
Інтерференцію поляризованих променів спостерігають при штучній анізотропії, яка може бути зумовлена деформацією або електричним полем. Зеебек і Брюстер (1816) відкрили явище фотопружності, яке полягає в тому, що оптично ізотропне тверде тіло під впливом механічної деформації стає оптично анізотропним (тіло набуває властивостей одноосного кристалу, вісь якого направлена вздовж напрямку стиску або розтягу). Різниця показників заломлення , де нормальна напруга. Таким чином, помістивши деформоване тіло між поляризатором і аналізатором, можна спостерігати інтерференційну картину. По вигляду інтерференційних смуг можна судити про розподіл напруг в досліджуваному тілі (кожна ізохромата проходить через точки, в яких однакові). На рис. 6.25 показано вигляд деформованої пластмасової моделі між двома схрещеними поляризаторами. Оптичний метод вивчення розподілу внутрішніх напруг на прозорих моделях деталей і конструкцій широко використовується в сучасній техніці і будівництві.
Штучна анізотропія, викликана електричним полем, була відкрита Кером (1875) і носить назву ефекту Кера. Схема його спостереження зображена на рис.6.26, де П і А поляризатор і схрещений з ним аналізатор, К комірка Кера (кювета з рідиною і плоским конденсатором). Під дією однорідного електричного поля ізотропна рідина набуває властивостей одноосного кристалу. При цьому
, (6.46)
де довжина хвилі світла у вакуумі, В стала Кера, Е напруженість електричного поля.
Анізотропія пояснюється тим, що рідина в електричному полі поляризується і набуває анізотропних властивостей. Орієнтація і дезорієнтація молекул відбувається на протязі секунди, тому при вимиканні електричного поля практично миттєво зникає світло після аналізатора, тобто комірка Кера працює як безінерційний світловий перемикач.
6.9.2. При проходженні лінійно-поляризованого світла через оптично активні речовини (кварц, розчин цукру) площина поляризації світла обертається навколо напрямку поширення променя. Кут повороту пропорційний до шляху , пройденому променем в речовині:
. (6.47)
Коефіцієнт називають постійною обертання.
В розчинах кут повороту площини поляризації пропорційний до шляху променя в розчині і концентрації розчину С:
(6.48)
де питома постійна обертання.
Залежність (6.48) використовується для вимірювання невідомої концентрації за відомою концентрацією розчину :
(6.49)
де кут повороту для невідомої концентрації, кут повороту для відомої концентрації.
Явище оптичної активності покладене в основу роботи цукрометрів приладів для вимірювання концентрації розчинів.
§6.10. Дисперсія світла
Дисперсією світла називається залежність абсолютного показника заломлення речовини n від частоти світла або від довжини хвилі , тобто
. (6.50)
Це явище спостерігається під час взаємодії світла з речовиною. Результатом дисперсії є розкладання в спектр білого світла, яке проходить через прозору скляну призму.
Якщо , то дисперсія світла в середовищі називається нормальною, тобто зі збільшенням частоти хвилі показник заломлення зростає. У випадку, коли , дисперсія світла називається аномальною (рис. 6.27).
Нормальна дисперсія світла спостерігається поза смугами або лініями поглинання, аномальна в межах смуг або ліній поглинання. Так, для скла смуги поглинання розміщені в ультрафіолетовій та інфрачервоній частинах спектру.
Класична електронна теорія пояснює дисперсію як результат взаємодії електромагнітних хвиль з електронами речовини. Нехай на прозорий діелектрик падає світлова хвиля. Тоді на його звязані електрони (e) з боку електричної компоненти електромагнітного поля діє сила
, (6.51)
де амплітудне значення електричної компоненти електромагнітної хвилі. Внаслідок взаємодії електронів з атомами виникає квазіпружна повертаючи сила
,
де m маса електрона, його власна частота коливань, x зміщення електрона.
Електрони діелектрика здійснюють вимушені коливання, що описуються диференціальним рівнянням
.
Звідси знаходиться зміщення електрона під дією електричного поля світлової хвилі
(6.52)
З курсу «Електрики» відомо, що діелектрична проникливість середовища під час поляризації діелектрика визначається за формулою
де діелектрична сприйнятливість середовища; Pe проекція вектора поляризації на напрям вектора напруженості електричного поля. З іншого боку, показник заломлення для прозорих середовищ ()
.
Отже,
.
Для діелектриків, атоми яких мають лише один “оптичний” електрон, проекція вектора поляризації (поляризованість)
,
де n0 концентрація атомів; pe наведений дипольний електричний момент атома.
Знак мінус показує, що вектор Pe напрямлений протилежно до зміщення x. Тоді показник заломлення діелектрика
. (6.53)
Враховуючи (6.52), дістанемо
. (6.54)
Необмежене зростання n при фізичного змісту не має і практично нездійсненне. Такий результат дістали тому, що не взяли до уваги втрати енергії на випромінювання вторинних електромагнітних хвиль, співудари між атомами, що випромінюють. Наближено ці втрати можна врахувати, коли припустити, що на кожний електрон діє сила опору, пропорційна до його швидкості:
де r коефіцієнт опору. Тепер диференціальне рівняння вимушених коливань оптичного електрона набуває вигляду:
.
Розвязок цього рівняння веде до такого виразу для показника заломлення:
. (6.55)
Ця залежність описує криву дисперсії, зображену на рис. 6.27. Коефіцієнт згасання значно менший за . Тому згасання істотно впливає на залежність n від лише в області частот , близьких до . Для областей, далеких від , формули (6.54) і (6.55) еквівалентні, бо
.
На явищі нормальної дисперсії (вдалині від резонансної чистоти ) ґрунтується робота призмових спектрометрів, за допомогою яких вивчають спектральний склад світла. З іншого боку, поблизу резонансної частоти стають особливо інтенсивними вимушені коливання електронів. Тому в області резонансної частоти спостерігають смугу поглинання (рис. 6.27, пунктирна крива).
§6.11. Квантова природа випромінювання. Теплове випромінювання
Нагріті тіла випромінюють електромагнітні хвилі. Це відбувається внаслідок перетворення енергії теплового руху молекул тіла в енергію випромінювання. Теплове випромінювання перебуває в рівновазі з випромінюючим тілом, тобто розподіл енергії між тілом і випромінюванням лишається незмінним для кожної довжини хвилі. Таке випромінювання називається рівноважним.
Теплове випромінювання єдиний вид випромінювання, яке може знаходитись в рівновазі з випромінюючими тілами. Рівноважність теплового випромінювання зумовлена тим, що його інтенсивність змінюється при зміні температури тіла. Нехай рівновага між світним тілом і випромінюванням порушена, і тіло випромінює енергії більше, ніж поглинає (або навпаки). Тоді температура його буде зменшуватись (або збільшуватись), доки не встановиться рівновага. Таким чином, порушення рівноваги у системі тіло-випромінювання викликає виникнення процесів, що відновлюють рівновагу. Такий рівноважний стан є стійким. Рівноважне випромінювання однорідне і неполяризоване, напрямки його поширення рівноймовірні, а спектр суцільний.
Розглянемо закони теплового випромінювання. Введемо поняття випромінювальної здатності як кількості енергії, яка випромінюється одиницею площі поверхні тіла за одиницю часу в одиничному інтервалі частот. Енергетична світність або інтегральна випромінювальна здатність це кількість енергії, яка випромінюється одиницею площі за одиницю часу, у всьому спектральному діапазоні, тобто
(6.55)
Поглинальна здатність тіла визначає долю енергії падаючих електромагнітних хвиль за одиницю часу на одиницю площі поверхні тіла в діапазоні частот від до яка поглинається тілом, тобто
(6.56)
Тіло називається абсолютно чорним, якщо воно при будь-якій температурі повністю поглинає всі падаючі на нього електромагнітні хвилі, тобто
. (6.57)
Для довільної частоти і температури відношення випромінювальної здатності тіла до його поглинальної здатності однакове для всіх тіл і дорівнює випромінювальній здатності абсолютно чорного тіла:
. (6.58)
Це є закон Кірхгофа в диференціальній формі.
Інтегральна випромінювальна здатність абсолютно чорного тіла:
. (6.59)
Макс Планк у 1900р. на основі квантових уявлень про процеси випромінювання теоретично обґрунтував спектральні закономірності теплового випромінювання, висунувши гіпотезу, згідно з якою атоми і молекули випромінюють енергію квантами. Енергія кванта випромінювання пропорційна до частоти:
, (6.60)
де стала Планка.
Формула Планка для спектрального розподілу випромінювальної здатності абсолютно чорного тіла має вигляд:
. (6.61)
На рис.6.28 зображені експериментальні залежності випромінювальної здатності абсолютно чорного тіла від частоти для різних температур. Обробка цих залежностей дозволили встановити експериментальні закони теплового випромінювання абсолютно чорного тіла: закон Стефана-Больцмана і закон зміщення Віна.
З формули Планка легко отримати ці закони.
Інтегральна випромінювальна здатність абсолютно чорного тіла
.
Перейдемо до нової змінної
тоді .
Звідси
де , оскільки .
Підрахунок дає: стала Стефана-Больцмана.
Отже, інтегральна випромінювальна здатність абсолютно чорного тіла пропорційна до четвертої степені абсолютної температури:
. (6.62)
Як видно, формула Планка дає змогу не тільки встановити закон Стефана-Больцмана, але й обчислити сталу .
Досліджуючи формулу Планка на екстремум, знайдемо, що частота , при якій спостерігається максимум випромінювальної здатності абсолютно чорного тіла, пропорційна до температури: . Перейшовши до відповідних довжин хвиль, отримаємо закон зміщення Віна
, (6.63)
де стала . Згідно з цим законом максимум випромінювальної здатності при зростанні температури тіла зміщується в короткохвильову ділянку спектра.
На законах Стефана-Больцмана і Віна базується робота пірометрів приладів, які дозволяють вимірювати безконтактно високі температури.
§6.12. Фотоефект
Розрізняють зовнішній і внутрішній фотоефект. Внутрішній фотоефект спостерігається в напівпровідниках і полягає в тому, що під дією світла електрони відриваються від атомів, але залишаються всередині кристалу, в результаті чого збільшується провідність напівпровідника.
Зовнішній фотоефект це явище виривання електронів з поверхні металу під дією світла. Зовнішній фотоефект був відкритий Герцем у 1887 р. і досліджений Столєтовим у 1888-89 рр. Схема дослідів Столєтова приведена на рис. 6.29. Ця схема дозволяє дослідити вольт-амперну характеристику вакуумного фотоелемента залежність фотоструму І від напруги U між електродами. Криві на рис. 6.29 відповідають двом різним освітленостям Ф катода. При збільшенні напруги все більша кількість вибитих електронів досягає анода, тому
фотострум зростає. Максимальне значення фотоструму Ін (струм насичення) відповідає таким значенням U, при яких усі електрони досягають анода. З воль-амперної характеристики видно, що при фотострум не зникає. Електрони, вибиті світлом з катода, мають відмінну від нуля кінетичну енергію і можуть досягти анода без зовнішнього поля. Для припинення фотоструму необхідно прикласти затримуючу напругу . При такій напрузі жоден з електронів не може досягнути анода. Отже, , тобто вимірюючи , можна знайти максимальне значення швидкості і кінетичної енергії фотоелектронів.
Основні закономірності фотоефекту:
Теоретичне пояснення фотоефекту дав Ейнштейн у 1905 р. Він використав гіпотезу Планка про квантову природу випромінювання світла і припустив, що енергія поглинутого кванта йде на роботу виходу електрона з метала і на надання електрону кінетичної енергії:
(6.64)
Це рівняння Ейнштейна для фотоефекту. Воно дає можливість правильно пояснити всі закони фотоефекту. Збільшуючи світловий потік даного спектрального складу, ми збільшуємо число квантів енергії, які падають на фотокатод. Це призводить до зростання кількості вирваних електронів, а, отже, і до зростання струму насичення (І закон фотоефекту).
Із (6.64) безпосередньо випливає, що максимальна кінетична енергія фотоелектрона лінійно зростає зі збільшення частоти падаючого випромінювання і не залежить від його інтенсивності, бо ні ν, ні А від інтенсивності світла не залежать (ІІ закон фотоефекту).
З рівняння Ейнштейна також випливає, що найменша частота ν світла, під дією якого відбувається фотоефект, визначається з умови ; звідси
. (6.65)
Найменша частота (найбільша довжина хвилі ), при якій ще можливий фотоефект, є червоною межею фотоефекту (ІІІ закон фотоефекту). Ця частота залежить тільки від роботи виходу електрона, тобто від хімічної природи речовини і стану її поверхні.
§6.13. Тиск світла
Тиск світла можна пояснити з квантової точки зору. Кванти світла (фотони) мають імпульс
. (6.66)
При падінні фотонів на поверхню відбувається зміна імпульсу поверхні, що і визначає тиск світла.
Нехай на одиницю поверхні тіла за одиницю часу падає n фотонів. При цьому число відбитих фотонів (R коефіцієнт відбивання), і (1 R)n число поглинутих фотонів. Тоді, за другим законом Ньютона, зміна імпульсу одиничної площадки за одиницю часу визначатиме тиск світла :
(6.67)
Враховуючи, що інтенсивність світла, отримаємо
. (6.68)
Для дзеркальної поверхні , а для чорної . Таким чином, тиск на дзеркальну поверхню вдвічі більший, ніж на чорну, що і спостерігав П.М. Лєбєдєв у своїх дослідах з вимірювання тиску світла.
§6.14. Ефект Комптона
Досліджуючи розсіяння рентгенівських променів в кристалах, Комптон (1923 р.) встановив, що в розсіяному випромінюванні, крім незміщеної компоненти з довжиною хвилі , існує зміщена компонента з довжиною хвилі . При розсіянні легкими атомами ( В) практично все розсіяне випромінювання має зміщену довжину хвилі. По мірі збільшення атомного номера все більша частина випромінювання розсіюється без зміни довжини хвилі.
Досліди Комптона показали, що різниця не залежить від довжини хвилі падаючого випромінювання і природи розсіючої речовини, а визначається лише величиною кута розсіяння :
, (6.69)
де стала величина комптонівська довжина хвилі для електрона.
Ефект Комптона можна пояснити з квантової точки зору, як процес пружного розсіяння рентгенівських квантів на слабо звязаних з атомами електронах. Розглянемо пружне зіткнення рентгенівського кванта, який має імпульс і енергію , з майже вільним електроном, котрий перебуває у стані спокою (енергія спокою , маса електрона). Квант, зітнувшись з електроном, передає йому частину своєї енергії та імпульсу. При цьому змінюється напрямок його руху (квант розсіюється, рис. 6.30) Зменшення енергії фотона означає збільшення його довжини хвилі.
Нехай імпульс та енергія розсіяного фотона дорівнюють і . Електрон внаслідок взаємодії отримує імпульс і енергію .
При кожному такому зіткненні виконуються закони збереження енергії та імпульсу. Згідно із законом збереження енергії
.
Звідси
. (6.70)
Згідно із законом збереження імпульсу
. (6.71)
За теоремою косинусів для трикутника імпульсів рівняння (6.71) перепишеться у скалярному вигляді як
. (6.72)
Прирівнюючи праві частини рівнянь (6.70) і (6.72), знайдемо:
.
Оскільки , , то
,
або
. (6.73)
Формула (6.73) добре узгоджується з результатами експериментальних досліджень ефекту Комптона. При цьому знайдено вираз комптонівської довжини хвилі для довільної частинки, яка приймає участь у розсіюванні.
Таким чином, світло одночасно проявляє властивості неперервних електромагнітних хвиль (інтерференція, дифракція) і властивості дискретних фотонів (фотоефект, ефект Комптона). Воно проявляє діалектичну єдність цих протилежних властивостей. У прояві хвильових і корпускулярних властивостей світла є закономірність: при малих довжинах хвиль більш чітко проявляються квантові властивості, і, навпаки, у довгохвильового випромінювання основну роль відіграють його хвильові характеристики. Можна зробити висновок, що корпускулярні і хвильові властивості світла не виключають, а, навпаки, взаємно доповнюють одна одну. Звязок між корпускулярними (імпульс фотона) і хвильовими (довжина хвилі) характеристиками світла забезпечується формулою
, (6.74)
де довжина хвилі, p імпульс фотона, h стала Планка.
Квадрат амплітуди світлової хвилі в деякій точці простору є мірою імовірності попадання фотонів в цю точку. Корпускулярні властивості зумовлені тим, що енергія і імпульс випромінювання локалізовані в дискретних частинках фотонах, хвильові є статистичними закономірностями розподілу фотонів у просторі.
§6.15. Гальмівне рентгенівське випромінювання
Рентгенівські промені виникають при бомбардуванні швидкими електронами твердих тіл. Такий процес реалізується в рентгенівських трубках. У найпростішому випадку це дво-електродна вакуумна трубка (рис.6.31), катод К якої є джерелом електронів, що виникають внаслідок явища термоелектронної емісії. Анод А, виготовлений із важких металів (Cu, Fe, Co, W тощо), служить мішенню.
Якщо між катодом і анодом прикладена велика напруга U, то електрони розганяються до енергій . Попадаючи в речовину анода, електрони сильно гальмуються, втрачають енергію і тому випромінюють електромагнітні хвилі гальмівне рентгенівське випромінювання.
Відомо, що заряд, який рухається прискорено, є джерелом електромагнітних хвиль із неперервним спектром. Спектр гальмівного рентгенівського випромінювання (рис.6.32) хоч і суцільний, але обмежений з боку малих довжин хвиль так званою короткохвильовою межею . З ростом прискорюючої напруги U зменшується. Класична електродинаміка не пояснює появи короткохвильової межі гальмівного випромінювання. Її існування безпосередньо випливає з квантової природи випромінювання. Якщо врахувати, що максимальна енергія рентгенівського кванта не може перевищувати кінетичної енергії електрона, то
. (6.75)
Звідси
, (6.76)
що відповідає експериментальним вимірюванням. Оскільки електрон віддає довільну і випадкову частину своєї енергії, то поява електромагнітного випромінювання різних довжин хвиль цілком зрозуміла.
При достатньо великій швидкості електронів, крім гальмівного випромінювання, виникає також характеристичне випромінювання (див. §7.9) у вигляді окремих спектральних ліній, що накладаються на суцільний спектр випромінювання (рис. 6.33).
Розділ 7. Елементи атомної фізики, квантової механіки і фізики твердого тіла
§7.1. Ядерна модель атома. Борівський воднеподібний атом. Спектральні серії
7.1.1. Оскільки світло випромінюється і поглинається атомами речовини, то виникає питання: яка структура атомів забезпечує дискретний (квантовий) характер вказаних процесів? Вперше конструктивну відповідь на це питання дав Резерфорд (1911р), досліджуючи розсіяння -частинок на тонких (товщина 1 мкм) металічних плівках (фольгах) (рис.7.1).
Центрований діафрагмою 2 пучок -частинок від джерела 1 розсіювався фольгою 3 під різними кутами від - до . Кількість -частинок (n), розсіяних під фіксованими кутами, реєструвалась приймачем 4, який міг переміщуватись по колу навколо центру фольги. Було встановлено (рис.7.2):
а) більшість -частинок, проходячи через фольгу, практично не розсіюється;
б) дуже добре виконується теоретично передбачуване співвідношення
в) певна, хоч і незначна, кількість -частинок розсіюється під кутами, близькими до .
Аналіз результатів експерименту дозволив Резерфорду запропонувати ядерну модель атома, згідно з якою в центрі атома розміщене позитивно заряджене ядро , що володіє масою, приблизно рівною масі атома. Навколо ядра рухаються електрони. Якщо в нейтральному атомі Z електронів, де Z порядковий номер елементу в періодичній таблиці елементів Д.І. Менделєєва, то заряд ядра , де елементарний заряд. В рамках цієї моделі зрозуміло, що ймовірність лобового зіткнення -частинки з ядром, яке забезпечує розсіяння на кути , дуже мала. Електрони ж в силу незначної маси розсіювати -частинки не можуть.
Оскільки, у відповідності з теоремою Ірншоу, неможлива стійка статична конфігурація електричних зарядів, то атом мусить бути динамічною системою, тобто електрони повинні рухатись навколо ядра по замкнених (колових чи еліптичних) орбітах. Такий рух є прискореним, і електрон з точки зору класичної фізики повинен втрачати енергію, випромінюючи електромагнітні хвилі, і тому впасти на ядро. Але, як відомо, атом стійка конфігурація електричних зарядів. І тому, приймаючи ядерну модель атома, потрібно відмовитись від класичного опису орбітального руху електронів.
7.1.2. Розвиваючи запропоновану модель, у 1913 р. Н. Бор висунув гіпотезу у вигляді наступних постулатів: а) із усіх можливих механічних станів (орбіт) електрона в атомі здійснюються лише такі, для яких момент імпульсу орбітального руху електрона кратний до постійної Планка h, тобто
, (7.1)
де квантове число стану (номер орбіти), а постійна Дірака; такі стани називаються стаціонарними;
б) перебуваючи в стаціонарному стані, електрон атома не випромінює і не поглинає енергії;
в) при переході з одного стаціонарного стану на інший електрон випромінює чи поглинає квант світла з енергією, рівною різниці енергій цих станів, тобто
. (7.2)
Отже, основна ідея постулатів Бора полягає в квантуванні (дискретності) механічних характеристик руху електронів: моменту імпульсу, енергії тощо. Рис.7.3 ілюструє наявність стаціонарних квантових станів (енергетичних рівнів) з енергіями та і випромінювальні та поглинальні переходи між ними: зменшення енергії електрона супроводжується випромінюванням кванту світла (фотона) з енергією ; поглинання кванту світла з енергією забезпечує збільшення енергії електрона від до . В цій моделі випромінювання (поглинання) квантів світла з енергіями є неможливим.
7.1.3. Запропонована теорія вперше була застосована до воднеподібних атомів (тощо), в яких навколо ядра, заряд якого , рухається по коловій орбіті радіусом r лише один електрон. При цьому ядро вважається нерухомим. Розглядаючи електрон як класичну матеріальну точку, енергію атома запишемо як суму кінетичної і потенціальної енергій електрона в кулонівському полі ядра
, (7.3)
де m маса електрона, електрична стала. Врахуємо, що в ролі доцентрової сили, яка забезпечує коловий рух електрона, виступає кулонівська сила, тобто
. (7.4)
Звідси випливає, що , і (7.3) запишеться у вигляді
. (7.5)
Оскільки орбітальний момент імпульсу електрона
,
то, врахувавши (7.4), отримаємо вираз для радіуса стаціонарної орбіти електрона
, (7.6)
де має зміст радіуса першої (n = 1) орбіти електрона в атомі водню (Z = 1); ця величина називається борівським радіусом. Отже, має місце квантування (n = 1, 2, 3, …) радіусів стаціонарних орбіт електрона.
Підставляючи (7.6) у (7.5), отримаємо вираз для енергії атома
. (7.7)
Введемо позначення: постійна Рідберга. Тоді (7.7) набуде остаточного вигляду
. (7.8)
Отже, енергія атома приймає дискретні значення, тобто квантується. Стан з найнижчою енергією (n = 1) називається основним, усі інші стани збудженими. Стан з найвищою енергією (n = ) відповідає іонізації атома. Отже, енергія іонізації воднеподібних атомів
, (еВ).
І тому зручно інколи (7.8) записувати у вигляді
. (7.9)
7.1.4. Зобразимо енергетичну діаграму атома водню (Z = 1) (рис.7.4). В основному стані атом може перебувати як завгодно довго. Якщо ж його перевести певним чином (теплом, світлом, бомбардуванням вільними електронами тощо) в довільний збуджений стан, то тривалість перебування в цьому стані складає , і атом самовільно переходить в основний чи нижчі збуджені стани, як показано на рис. 7.4. При цьому, у відповідності з (7.2) та (7.8), випромінюється фотон з енергією
,
а довжина випромінюваної світлової хвилі розраховується за серіальною формулою Бальмера
, (7.10)
де n2 квантове число стану, з якого відбувається перехід, n1 квантове число стану, в який переходить атом.
Якщо забезпечити умови “заселеності” усіх збуджених станів, то в спектрі випромінювання атомарного водню спостерігатиметься значна кількість спектральних ліній, які можна згрупувати в наступні серії:
Ісерія Лаймана, для якої а ;
ІІсерія Бальмера, для якої а ;
ІІІсерія Пашена, для якої а ;
ІVсерії Брекета, для якої а , тощо.
Лінії серії Лаймана лежать в ультрафіолетовій області, серії Бальмера у видимій області, серії Пашена, Брекета в інфрачервоній області. Відмітимо, що довжини хвиль, розраховані за формулою (7.10), дуже добре співпадають з експериментальними значеннями.
На цьому тріумф теорії Бора закінчується, бо вона виявилась нездатною пояснити спектри випромінювання складних (неводнеподібних) атомів, а також інтенсивності спектральних ліній навіть атомарного водню. Слабкість цієї теорії полягає в тому, що, ввівши нехарактерні для класичної фізики поняття про квантування фізичних величин і про квантові переходи (”стрибки”), в усьому іншому вона залишилась класичною. І тому послідовна, квантовомеханічна теорія повинна ґрунтуватись на нових (некласичних) принципах опису стану і руху мікрочастинок.
§7.2. Корпускулярно-хвильовий дуалізм матерії; гіпотеза де Бройля. Співвідношення невизначеностей Гайзенберга
7.2.1. Як показано в розділі 6, світло володіє як хвильовими, так і корпускулярними властивостями. Луї де Бройль (1924 рік) висунув гіпотезу (постулат) про те, що корпускулярно-хвильовий дуалізм притаманний не тільки світлу, але матерії взагалі: усяка частинка, яка має імпульс і енергію Е, володіє хвильовими властивостями, її рух супроводжується хвильовим процесом з довжиною хвилі де-Бройля
(7.11)
та частотою
. (7.12)
В залежності від величини швидкості v (кінетичної енергії ) частинок, їх імпульс розраховується або за класичною формулою (при )
, (7.13)
або за релятивістською формулою (при , Еk співмірна з Е0)
, (7.14)
де m маса частинки (таблична величина), її енергія спокою.
Зокрема, вільна частинка, що рухається вздовж осі х, описується плоскою хвилею де Бройля
, (7.15)
де амплітуда хвилі де Бройля, її циклічна частота, її хвильове число. Фазова швидкість хвиль де Бройля
, (7.16)
а групова швидкість
(7.17)
Борівське квантування моменту імпульсу орбітального руху електрона набуває нового змісту з врахуванням хвильових властивостей електрона. Зокрема, довжина стаціонарної орбіти
,
тобто в межах орбіти вкладається ціле число хвиль де Бройля.
Оцінимо довжину хвилі де Бройля електрона, який прискорився електричним полем . Саме такі напруги використовуються у вакуумних електронних приладах (радіолампи, рентгенівські трубки тощо). Підставляючи в формулу (7.13) значення кінетичної енергії електронів еВ, отримаємо за (7.11) для довжин хвиль де Бройля нм.
Відомо, що найбільш чітко хвильові властивості світла проявляються в явищі дифракції. І тому прояв хвильових властивостей електронних (нейтронних, атомних тощо) пучків слід очікувати в цьому ж явищі. При цьому чітка дифракційна гратка спостерігається тоді, коли довжини хвиль співмірні з розміром дифракційної неоднорідності (отвори, щілини тощо).
Розміри макроприладів значно перевищують довжини хвиль де Бройля електронів, і тому в цьому випадку хвильові властивості електронів явно не відслідковуються. В цей же час розраховані значення співмірні з розміром (нм) кристалічної гратки твердих тіл. І тому така гратка повинна бути дифракційним пристроєм для електронних пучків. Дійсно, при проходженні електронних пучків через тонкі полікристалічні плівки та при їх відбиванні від монокристалів спостерігається така ж дифракційна картина, як і при взаємодії рентгенівських променів з твердими кристалічними тілами. Зокрема, виконується закон Вульфа-Бреггів (див. розділ 6), встановлений для рентгенівських променів. Дифракція нейтронних пучків також виявлена експериментально і використовується для наукових досліджень.
Відмітимо, що довжини хвиль де Бройля макроскопічних тіл, за рахунок великої маси, настільки малі, що їх хвильові властивості виявити неможливо.
7.2.2. Корпускулярно-хвильовий дуалізм частинок в мікросвіті накладає обмеження на можливості класичного опису їх стану. В класичній механіці стан частинки задається сукупністю точно заданих координат (x,y,z) та проекцій вектора імпульсу . Якщо задані сили, що діють на частинку, то можна, користуючись законами класичної механіки, передбачити її стан в довільний момент часу класичний принцип причинності. Для частинки, що рухається вздовж осі х, це означає, що неточності (невизначеності) координати та імпульсу рівні нулю і добуток .
Абсолютно інша ситуація в мікросвіті. Дійсно, вільна частинка, яка рухається вздовж осі х, описується плоскою монохроматичною хвилею де Бройля (7.15), де . І тому її положення повністю невизначене, тобто . З іншого боку, імпульс такої частинки строго визначений і . А отже, добуток є математично невизначеним .
В мікросвіті можна змоделювати обєкти (наприклад, хвильовий пакет), для яких координата точно визначена , але імпульс повністю невизначений , і тому має місце математична невизначеність типу
Для того, щоб дещо прояснити цю ситуацію, розглянемо наступний умовний експеримент (рис. 7.5). Нехай мікрочастинки, що рухаються вздовж осі х, пролітають через щілину шириною а в непрозорому екрані (1) і фіксуються на екрані спостереження (2). Після проходження щілини розподіл мікрочастинок вздовж осі у повинен відтворювати розподіл інтенсивності в дифракційній картині (3): центральний і бічні максимуми розділені мінімумами. До щілини невизначеності координати та імпульсу: , . В момент проходження щілини: , . Якщо розглядати лише мікрочастинки, які попадають в центральний максимум, що обмежений першими мінімумами, то , і тому . Добуток невизначеностей:
.
На підставі аналізу подібних умовних експериментів Гайзенберг (1927р.) встановив співвідношення між невизначеностями координат і відповідних імпульсів у вигляді
. (7.18)
Інтерпретацію цих співвідношень дав Н. Бор у вигляді принципу доповнюваності:
1) інформація про стан мікрочастинок може бути отримана лише за допомогою макроприладів, які взаємодіють з мікрочастинками;
2) за допомогою конкретного макроприладу можна встановити точне значення або координати, або імпульсу; при цьому чим точніше задана одна характеристика, тим більш невизначена інша.
Стосовно електрона в атомі співвідношення Гейзенберга означають, що поняття орбіти втрачає зміст. Дійсно, якщо невизначеність швидкості електрона , то невизначеність координати , що співмірно з розміром атома. Таким чином, електрон “розмазаний” по всьому обємі атома. В цей же час співвідношення невизначеностей не накладають суттєвих обмежень на класичний опис стану макротіл. Дійсно, оскільки , то навіть при .
Пара “координата-імпульс” у співвідношенні (7.18) не є випадковою, оскільки вона входить як добуток в рівняння плоскої хвилі де Бройля (7.15), записане у вигляді
. (7.19)
І тому слід очікувати, що і для іншої пари “енергія-час” матиме місце співвідношення невизначеностей
, (7.20)
де має зміст тривалості перебування (часу життя) мікрочастинки в певному стані. Зокрема, для основного стану електрона у воднеподібному атомі і тому , тобто енергетичний рівень основного стану нерозмитий. Для збуджених станів і . За рахунок цього спектральні лінії випромінювання не є строго монохроматичними.
§7.3. Хвильова функція та її зміст. Рівняння Шрьодінгера
7.3.1. Корпускулярно-хвильовий дуалізм матерії встановлює межі застосування класичної фізики. В мікросвіті класичний спосіб опису стану частинок за допомогою координат та імпульсів перестає бути однозначним і повинен бути замінений іншим статистичним способом, на якому грунтується механіка мікросвіту квантова механіка.
Стан мікрочастинок в квантовій механіці задається хвильовою функцією . Зокрема, для вільної одновимірної частинки хвильовою функцією є плоска хвиля де Бройля (7.19), яку представимо тут у комплексній формі:
, (7.21)
де . Помноживши на комплексно спряжену функцію , отримаємо
. (7.22)
З точки зору хвильових уявлень квадрат амплітуди хвилі визначає її інтенсивність, зокрема, інтенсивність дифракційних максимумів на рис. 7.5. З точки зору корпускулярних уявлень це імовірність попасти мікрочастинці в ту чи іншу точку екрану спостереження після проходження щілини. Отже, фізичний зміст має не сама хвильова функція, а вираз , який називається густиною імовірності. Для частинок, які не є вільними, а перебувають в силових полях, хвильова функція не може розглядатися як просторова хвиля, але її ймовірнісна інтерпретація залишається в силі. Зокрема, імовірність знайти мікрочастинку в деякій області простору, наприклад, в елементарному обємі , становить
. (7.23)
Оскільки імовірність повинна бути однозначною, неперервною і скінченою, то на хвильову функцію накладаються наступні стандартні вимоги:
1) вона повинна бути однозначною, неперервною і скінченою;
Знання хвильової функції дозволяє встановити середнє значення довільної фізичної величини f:
. (7.24)
Для знаходження хвильової функції конкретного квантовомеханічного обєкту необхідно розвязати рівняння Шрьодінгера (1926 р.)
, (7.25)
яке є аналогом ІІ закону Ньютона класичної механіки. В цьому рівнянні
(7.26)
оператор Гамільтона або оператор повної енергії частинки, де m маса частинки, оператор Лапласа
, (7.27)
U оператор потенціальної енергії, дія якого зводиться до простого множення на хвильову функцію.
Якщо потенціальна енергія частинки явно не залежить від часу, тобто , то квантовомеханічна задача називається стаціонарною, і у хвильовій функції можливе розділення змінних, тобто
. (7.28)
Підставляючи (7.28) у (7.25), після нескладних перетворень отримаємо
, (7.29)
, (7.30)
де с і Е константи інтегрування, при цьому Е має зміст енергії частинки.
Рівняння (7.30) називається рівнянням Шрьодінгера для стаціонарних станів. Розвязок цього диференціального рівняння задовольняє стандартні вимоги до хвильової функції, як правило, не при усяких, а дискретних (дозволених) значеннях параметра Е. Ці значення називаються власними значеннями оператора , а відповідні хвильові функції власними функціями цього оператора.
Отже, розвязок рівняння Шрьодінгера (7.30) зводиться до знаходження власних значень і власних функцій оператора повної енергії частинки . При цьому дискретність (квантування) енергії не вимагає додаткових штучних припущень типу постулатів Бора (§7.1), а витікає з математичних властивостей самого рівняння Шредінгера. Фізична ж суть цього рівняння полягає у виборі аналітичної форми потенціальної енергії U, тобто у виборі моделі квантомеханічного обєкту.
7.3.3. Для вільної (U=0) частинки, що рухається вздовж осі х, стаціонарне рівняння Шрьодінгера має вигляд
.
Розвязок цього рівняння шукається у вигляді
,
що легко перевірити підстановкою в рівняння Шрьодінгера.
Повна хвильова функція, з врахуванням (7.28) і (7.29),
співпадає з виразом для плоскої хвилі де Бройля (7.19), якщо покласти, що . Остання рівність є очевидною, оскільки повна енергія частинки співпадає з її кінетичною енергією
. (7.31)
§7.4. Частинка в одновимірній прямокутній потенціальній ямі. Проходження частинки через потенціальний барєр
7.4.1. Усякий звязаний стан частинки (вільний електрон в металі, нуклон в ядрі тощо), тобто стан з відємною потенціальною енергією, можна описати, ввівши поняття потенціальної ями. Розглянемо найпростіший випадок, коли частинка масою m перебуває в одновимірній прямокутній нескінченно глибокій потенціальній ямі шириною . Оскільки початок відліку потенціальної енергії можна вибирати довільно, то задачу про “яму” замінимо задачею про “ящик”, на дні якого потенціальна енергія дорівнює нулю, а стінки якого нескінченно високі (рис. 7.6). Оператор Гамільтона (7.26) для цього випадку має вигляд
,
де
Всередині ящика рівняння Шрьодінгера (7.30) запишеться як
або
. (7.32)
Введемо позначення
, (7.33)
де k має зміст хвильового числа, якщо врахувати (7.31). Тоді (7.32) набуде форми, подібної (формально) до диференціального рівняння власних гармонічних коливань,
.
Розвязок цього рівняння шукаємо у вигляді гармонічної функції координати х:
. (7.34)
Оскільки хвильова функція повинна бути неперервною, в тому числі і на стінках ями, а вийти за межі ями частинка не може, то . Перша гранична умова дає , і тому
. (7.35)
Друга гранична умова дає
, (7.36)
де n = 1, 2, 3, … квантове число стану частинки.
Врахувавши, що , отримаємо з (7.36) співвідношення , тобто в межах ширини ями повинно вкладатись ціле число півхвиль де Бройля.
Формальну амплітуду А в (7.35) знайдено з умови нормування хвильової функції до одиниці:
.
Звідси , і остаточно хвильова функція частинки в довільному квантовому стані n, з врахуванням (7.36), набуває вигляду
. (7.37)
Обєднуючи (7.33) і (7.36), отримаємо вираз для енергії частинки в різних квантових станах
. (7.38)
Отже, енергія частинки в потенціальній ямі приймає не довільні, а дискретні значення Е1, Е2, Е3, …, зображені на рис. 7.6 відповідними енергетичними рівнями. Густина імовірності (на рисунку штрихові лінії) залежить від координати частинки, при цьому по різному в кожному квантовому стані. Наприклад, для центру ями вона максимальна в стані n = 1 і дорівнює нулю в стані n = 2.
Відстань між сусідніми енергетичними рівнями
. (7.39)
Розглядаючи електрон в атомі як такий, що перебуває в потенціальній ямі шириною , отримаємо , що співмірно з енергією електрона. В цей же час в макросвіті, коли m i l дуже великі, відстань між енергетичними рівнями стає зникаюче малою, і квантуванням енергії можна знехтувати.
Задача про частинку в потенціальній ямі скінченої глибини розвязується значно складніше, але висновок про квантування енергії і в цьому випадку залишається в силі.
7.4.2. Спорідненою до описаної є задача про проходження частинки через потенціальний барєр. Нехай мікрочастинка з масою m і енергією Е налітає на одновимірний прямокутний потенціальний барєр шириною l і висотою U0 (рис. 7.7). Якщо частинка класична, то вона пролітає над барєром, коли Е > U0, і відбивається від нього, коли Е < U0. Проникнути під барєр класична частинка не може, бо тоді її кінетична енергія була б меншою від нуля. Розвязок рівняння Шредінгера для квантомеханічної мікрочастинки дає, що хвильові функції в усіх трьох областях відмінні від нуля, тобто мікрочастинка проникає під барєр і за барєр. Це явище називається тунелюванням. Відємні значення кінетичної енергії мікрочастинки в момент проходження барєру не можуть турбувати, бо в квантовій механіці кінетична енергія , як і потенціальна енергія, не є точно визначеними. Прозорість барєру, тобто імовірність тунелювання частинки, знаходиться як відношення густин імовірності в областях ІІІ та І. Розрахунок дає
. (7.40)
Звідси видно , що барєр тим прозоріший, чим менші його ширина і висота. Для класичної частинки (m ) і макробарєру (l ) прозорість барєру зникаюче мала.
§7.5. Квантовий лінійний гармонічний осцилятор
7.5.1. Лінійний гармонічний осцилятор це матеріальна точка, яка здійснює одновимірний (вздовж осі х) рух під дією квазіпружної сили . Потенціальна енергія осцилятора (рис. 7.8)
, (7.41)
де m маса осцилятора, його власна циклічна частота, х зміщення від положення рівноваги. Отже, мова піде про мікрочастинку, яка перебуває в потенціальній ямі з параболічними стінками. Підставляючи (7.41) в рівняння Шрьодінгера (7.30), отримаємо
. (7.42)
Власні хвильові функції, тобто розвязки цього рівняння, які задовольняють стандартні вимоги (§7.3), мають вигляд
, (7.43)
де , поліноми Чебишева-Ерміта -го порядку, коливальне квантове число.
Для класичного осцилятора зміщення х обмежене амплітудою коливань ; для квантового осцилятора таке обмеження знімається за рахунок можливості тунелювати через стінки потенціальної ями. А це означає, що існує ненульова імовірність знайти мікрочастинку поза ямою.
Власні значення оператора Гамільтона для квантового осцилятора
. (7.44)
Тут враховано, що . Отже, енергія квантового осцилятора приймає дискретні значення , тобто квантується (рис.7.8). Найменша енергія квантового осцилятора, так звана нульова енергія, на відміну від класичного осцилятора, не дорівнює нулю. Наявність нульових коливань підтверджується експериментально в дослідах по розсіянню світла в кристалах при дуже низьких температурах, коли з точки зору класичної фізики коливальний рух кристалічної гратки повинен би припинитися.
Перебуваючи в стаціонарному стані, квантовий осцилятор не поглинає і не випромінює енергії. Випромінювання (поглинання) світла відбувається при переході осцилятора між стаціонарними станами, при цьому квантова механіка дозволяє лише переходи між сусідніми енергетичними рівнями, тобто (правило відбору). Енергія випромінюваного (поглинутого) кванту , що підтверджує квантовий постулат Планка.
§7.6. Воднеподібні атоми в квантовій механіці. Квантові числа
7.6.1. З врахуванням виразу (7.3) для потенціальної енергії електрона в кулонівському полі ядра воднеподібного атома, стаціонарне рівняння Шрьодінгера набуде вигляду
. (7.45)
Оскільки кулонівське поле володіє центральною симетрією, то зручно перейти до сферичних координат (рис. 7.9), де положення довільної точки А описується трьома координатами . В цьому випадку рівняння Шредінгера набуває вигляду, складнішого від (7.45), але зявляється можливість представити хвильову функцію як добуток радіальної функції R(r) і кутової , тобто провести розділення змінних:
. (7.46)
Стандартні вимоги як до хвильової функції в цілому, так і до окремих складових забезпечуються лише при певних, дискретних значеннях не тільки енергії електрона, але і квадрату моменту імпульсу його орбітального руху , а також проекції цього моменту на вибраний напрямок (вісь z). Квантування вказаних характеристик визначається трьома квантовими числами: головним n, орбітальним (азимутальним) та магнітним наступним чином:
, (7.47)
де n=1,2,3,…, тобто співпадає з (7.8) для борівського воднеподібного атома;
, (7.48)
де = 0,1,2,…, (n-1);
, (7.49)
де .
Магнітне квантове число вказує на просторове квантування моменту імпульсу електрона: вектор моменту імпульсу електрона може мати лише такі орієнтації в просторі, що його проекції на вибрану вісь z (яка задається, як правило, напрямком магнітного поля) кратні (рис. 7.10).
Оскільки енергія електрона визначається лише головним квантовим числом n, а хвильова функція усіма квантовими числами, то декільком станам з різними та відповідає одне значення енергії. Така ситуація називається квантовомеханічним виродженням. Наприклад, енергія реалізується в чотирьох станах з хвильовими функціями . В загальному, кратність виродження дорівнює . Для ілюстрації приведемо вирази для радіальних і кутових функцій в декількох станах:
(7.50)
де борівський радіус.
Для основного стану (n = 1) хвильова функція має вигляд
.(7.51)
Імовірність знайти електрон в сферичному шарі товщиною dr, тобто в елементарному обємі , становить
а в шарі одиничної товщини
. (7.52)
Як видно з рис. 7.11, залежність володіє різким максимумом при r = а0. Отже, борівська орбіта в квантовій механіці може інтерпретуватись як геометричне місце точок, де імовірність перебування електрона максимальна. Але, оскільки заряд електрона “розмазаний” по усьому атомі , то в квантовій механіці, у відповідності зі співвідношенням невизначеностей Гайзенберга, поняття орбіти (траєкторії) електрона втрачає зміст.
7.6.2. Стани електрона з різними значеннями орбітального квантового числа прийнято позначати наступним чином:
0 |
1 |
2 |
3 |
4 |
. |
|
Стан |
s |
p |
d |
f |
g |
Тому енергетичні рівні з різними n реалізуються наступними станами:
n = 1 |
стан |
1s; |
|||
n = 2 |
стани |
2s, |
2p; |
||
n = 3 |
стани |
3s, |
3p, |
3d; |
|
n = 4 |
стани |
4s, |
4p, |
4d, |
4f. |
Стан 1 s є основним, усі інші стани збуджені. Час життя електрона в збудженому стані складає ~.
Енергетична діаграма квантовомеханічного атома водню має вигляд (рис.7.12), який дещо відрізняється від діаграми борівського атома (рис.7.4). Як і раніше, квантова механіка не накладає жодного обмеження на зміну головного квантового числа. В цей же час зміна і регламентується правилами відбору
. (7.53)
Друге правило відбору тут не проявляється, але стає важливим, коли випромінюючі атоми перебувають в магнітному полі.
§7.7. Магнітний момент атомів. Досліди Штерна і Герлаха. Власний момент електрона (спін). Ферміони і бозони
7.7.1. Користуючись формальним поняттям орбіти електрона, орбітальний рух електрона (рис.7.13) можна розглядати як коловий струм, що володіє магнітним моментом
де частота обертання електрона, маса електрона.
Оскільки механічний і магнітний моменти, як видно з рис.7.13, напрямлені протилежно, то остаточно
. (7.54)
Якщо атом перебуває в магнітному полі з індукцією , то проекція магнітного моменту орбітального руху на напрямок поля, з врахуванням (7.49),
, (7.55)
де магнетон Бора. Отже, ми приходимо до квантування проекції магнітного моменту на напрямок поля; звідси стає зрозумілою назва квантового числа . Магнітний момент атома шукається як векторна сила магнітних моментів усіх електронів () і може бути як рівним нулю (діамагнітні атоми), так і відмінним від нуля (парамагнітні атоми).
7.7.2. Для експериментального визначення магнітних моментів атомів Штерн і Герлах (1921 р.) пропускали у вакуумі вузькі атомні пучки через сильно неоднорідне магнітне поле (рис.7.14). В такому полі на атом з магнітним моментом діє відхиляюча сила
,
де градієнт магнітного поля вздовж осі z, а проекція магнітного моменту атома на напрямок поля. У відсутності квантування РП фіксував би неперервний розподіл атомів, оскільки значення були б довільними. В дійсності спостерігається розщеплення атомних пучків на декілька, симетричних відносно осьової лінії ДО, що свідчить про наявність просторового квантування. Але деталі експерименту не зовсім узгоджувались з теорією.
Зокрема, в атомах срібла магнітний момент повинен визначатися лише одним валентним електроном, який в умовах експерименту перебуває в s-стані . А це означає, що для срібла Рат = 0, і розщеплення атомного пучка не слід очікувати, що суперечить експерименту.
7.7.3. Додаткову інформацію про магнітні параметри електронів атомів дають дослідження впливу магнітного поля на спектри випромінювання. Для прикладу розглянемо спектральну лінію, зумовлену переходом електрона з 2р-стану в 1s-стан атома водню (рис. 7.15). Якщо випромінюючий атом перебуває в магнітному полі, то електрон набуває додаткової енергії
. (7.56)
Оскільки у 2р-стані магнітне квантове число набуває значення 0, , то в магнітному полі енергетичний рівень цього стану розщеплюється на три рівні, тобто виродження по знімається. І в спектрі випромінювання замість однієї спектральної лінії з частотою зявляються три лінії з частотами , і , де “нормальне” лоренцове зміщення. Розщеплення спектральних ліній випромінювання атомів в магнітному полі називається ефектом Зеемана. Але лише для не багатьох спектральних ліній деяких атомів спостерігається “нормальний” ефект Зеемана, коли експеримент узгоджується з викладеною теорією. В більшості випадків має місце “аномальний” ефект , коли характер розщеплення як якісно, так і кількісно інший, ніж це передбачено теорією.
7.7.4 Для пояснення дослідів Штерна і Герлаха, “аномального” ефекту Зеемана, а також спектрів випромінювання складних атомів необхідно було ввести ще одне квантове число електрона. І тому Гоудсміт і Уленбек (1925 р.) висунули гіпотезу про те, що електрон володіє власним моментом імпульсу, не повязаним з його просторовим рухом,
, (7.57)
де s спінове квантове число, яке для електрона дорівнює . З цим моментом повязаний власний магнітний момент
. (7.58)
Проекції цих моментів на вибраний напрямок (вісь z)
,
, (7.59)
де магнітне спінове квантове число електрона. Отже, в дослідах Штерна і Герлаха атоми срібла можуть мати два значення проекції магнітного моменту на напрямок магнітного поля , і тому атомний пучок розщеплюється на два симетричних , що спостерігається експериментально (рис.7.14).
7.7.5 Пізніше виявилось, що власний (спіновий) рух притаманний усім мікрочастинкам (атомам, ядрам, протонам, нейтронам тощо). Спін така ж характеристика мікрочастинок як маса і заряд. Наявність спіну випливає з розвязку релятивістського аналогу рівняння Шрьодінгера рівняння Дірака. В залежності від значення квантового числа s усі мікрочастинки поділяються на ферміони частинки з напівцілим спіном і бозони частинки з цілочисельним спіном . До ферміонів належать електрони, протони, нейтрони, до бозонів фотони, -мезони. Атоми та ядра можуть бути як ферміонами, так і бозонами. Поділ мікрочастинок на ферміони і бозони є наслідком принципу квантової нерозрізняльності тотожних частинок, що для системи з двох тотожних частинок дає , тобто густина імовірності не змінюється при перестановці частинок місцями (тут хiсукупність просторових і спінових координат і-тої частинки). Звідси можливі два варіанти:
симетрична хвильова функція;
антисиметрична хвильова функція.
Бозони описуються симетричними, а ферміони анти-симетричними хвильовими функціями.
§7.8. Принцип Паулі. Стани електронів в складних атомах
7.8.1. Отже, електрони в атомі описуються четвіркою квантових чисел: головне квантове число n, орбітальне квантове число , магнітне квантове число і магнітне спінове квантове число . У воднеподібних атомів енергія електрона залежить лише від головного квантового числа. В складних, багатоелектронних атомах окремий електрон перебуває в полі не тільки ядра, але і решти електронів. Це призводить до зняття виродження по , і енергія електрона залежить як від n, так і від . При цьому, як правило, залежність від n сильніша.
Якщо багатоелектронний атом перебуває в незбудженому стані, то його електрони намагатимуться зайняти стани з мінімальною енергією (стан стійкої рівноваги). Таким є стан 1s (n = 1; = 0). Але реалізувати таку ситуацію забороняє принцип Паулі (1925 р.), справедливий лише для ферміонів: в системі тотожних ферміонів в певному стані може перебувати лише одна частинка. Оскільки електрони є ферміонами, то цей принцип стосовно електронів в атомі формулюється наступним чином: лише один електрон в атомі може володіти тотожним набором чотирьох квантових чисел: . А це означає, що в стані 1s може перебувати лише два електрони з протилежними спінами (), решта електронів повинна перебувати в інших станах. Для опису розподілу Z електронів незбудженого багатоелектронного атома по станах введемо поняття шарів і оболонок.
До шару належать електрони, які мають однакове головне квантове число n. Максимальна кількість електронів в шарі 2n2. Шари класифікуються як: К(n = 1), L(n = 2), M(n = 3), N(n = 4) тощо. До оболонки належать електрони, які мають однакові квантові числа n і . Максимальна кількість електронів в оболонці 2(2+1). Оболонки класифікуються як: 1s(n = 1, = 0), 2s(n = 2, = 0), 2p(n = 2, = 1) тощо. Електронна конфігурація, наприклад, атома міді, який має 29 електронів, представлена наступним чином:
1s2 2s2 2p6 3s2 3p6 3d10 4s1.
Тут цифри над символами оболонок вказують на кількість електронів в них. Видно, що К-шар вміщує лише одну оболонку, інші шари мають по декілька оболонок.
6.8.2. Взаємодія між електронами складних атомів зумовлена як чисто електростатичними силами, так і магнітними силами, оскільки кожен електрон володіє як орбітальним, так і спіновим магнітним моментом. Остання взаємодія називається спін-орбітальною.
Якщо електростатична взаємодія сильніша від спін-орбітальної, то реалізується звязок Рассель-Саундерса, при якому спочатку сумуються окремо орбітальні, окремо спінові моменти усіх електронів атома (оболонки, шару), тобто
.
А сумарний (повний) момент електронів атома (оболонки, шару) шукається як векторна сума орбітального і спінового моментів, тобто
.
Квадрат цих векторів виражається через відповідні квантові числа L, S, J наступними співвідношеннями:
(7.60)
де L орбітальне квантове число атома (оболонки, шару), яке приймає цілочисельні значення між максимальним і мінімальним значенням алгебраїчної суми , S спінове квантове число атома (оболонки, шару), яке приймає значення між максимальним і мінімальним значенням алгебраїчної суми , J внутрішнє квантове число атома (оболонки, шару), яке може приймати значення від до L + S. Наприклад, для частково заповненої оболонки np2 вказані квантові числа можуть приймати значення: L = 0, 1, 2; S = 0, 1; J = 0, 1, 2. Відмітимо, що одночасно не може реалізуватися ситуація, в якій L = 2 i S = 1, (а, отже, J = 3), бо при цьому порушиться принцип Паулі.
Стани з різними можливими значеннями квантових чисел L, S, J називаються термами, які позначаються символічно як , де замість числового значення L пишуть відповідну велику букву S(L = 0), P(L = 1), D(L = 2) тощо. Для наведеного прикладу можливими є наступні терми: . Зрозуміло, що основний стан оболонки, тобто стан з мінімальною енергією, реалізується через один з наведених термів (в даному випадку таким є терм ). Усі інші терми характеризують збуджені стани.
Звязок Рассель-Саундерса реалізується в більшості атомів. Але для деяких великих атомів спін-орбітальна взаємодія сильніша від електростатичної. В цьому випадку реалізується звязок (jj), при якому спочатку додаються векторно орбітальний і спіновий моменти окремих електронів, утворюючи повний момент і-го електрона
а сумарний повний момент атома (оболонки, шару) визначається як векторна сума повних моментів окремих електронів:
(7.61)
де J знову ж внутрішнє квантове число атома (оболонки, шару).
Розрахунок згадуваних моментів атомів полегшується тим, що для повністю заповненої оболонки ці моменти дорівнюють нулю. Проілюструємо це для p-оболонки атома зі звязком Рассель-Саундерса, використавши сумування проекцій моментів на вісь z, тобто використовуючи квантові числа і усіх електронів p-оболонки, з урахуванням принципу Паулі. Дійсно:
В такому разі стан атома визначається електронами частково заповнених оболонок. В більшості атомів внутрішні оболонки (1s, 2s, 2p, …) заповнені повністю, а частково заповнена лише зовнішня оболонка (хоч і є винятки). Електрони зовнішніх оболонок найслабше звязані зі своїм ядром і тому забезпечують звязок між атомами в молекулах і в кристалічних гратках твердих тіл. Такі електрони називаються валентними, вони відповідальні за спектри випромінювання і поглинення атомів.
§7.9. Характеристичне рентгенівське випромінювання
З попереднього є очевидним, що переходи між енергетичними рівнями повністю заповнених шарів і оболонок є неможливими. Але ситуація змінюється, якщо певним чином вибити електрон з глибокого шару, наприклад, при бомбардуванні металічного анода (антикатода) рентгенівської трубки швидкими електронами (§6.15). Після вибивання електрона з внутрішнього шару на вакантне місце може перейти електрон з вищого шару, при цьому випромінюється квант , у відповідності з енергетичною діаграмою, зображеною на рис. 7.16. Таке випромінювання називається рентгенівським характеристичним; воно володіє лінійчатим спектром, характерним для матеріалу антикатода. Лінії характеристичного випромінювання накладаються на суцільний спектр гальмівного випромінювання (рис. 6.33).
Відмітимо, що на енергетичній діаграмі (мал. 7.16) зображені терми оболонок з вакансіями, бо лише в такому атомі можливі переходи між шарами. При цьому можливі не усякі переходи, а лише ті, при яких виконуються наступні правила відбору: а для обмежень немає.
Спектральні лінії характеристичного рентгенівського випромінювання групуються в серії K, L, M, N ... Зрозуміло, що К-серія формується при переході електронів на вакантні місця в К-шарі (n1 = 1) з вищих шарів L, M, N, … (n2 = 2,3,4,…), при цьому випромінюються відповідно лінії. Аналогічно L-серія формується при переході електронів на вакансії L-шару () з вищих шарів (). Для М-серії , а для N-серії .
Важливо зауважити, що енергетична відстань між термами різних шарів значно перевищує відстань між термами одного шару (якщо б на мал. 7.16 був дотриманий масштаб, то терми одного шару практично зливалися б). І тому в першому наближенні дискретністю термів в межах одного шару можна знехтувати і вважати, що енергія визначається лише квантовим числом n. Це дозволяє розраховувати довжини хвиль спектральних ліній в серіях за допомогою формули Мозлі
(7.62)
де R введена раніше постійна Рідберга (§7.1), а - постійна екранування. Фізичний зміст цієї постійної стає зрозумілим, якщо врахувати, що електрон, який здійснює перехід, перебуває в полі не тільки ядра з зарядом +Ze, як у випадку воднеподібних атомів, але і в полі електронів шару, на який відбувається перехід. Поле цих електронів послаблює (екранує) поле ядра. Зокрема, в К-шарі лише один електрон (другий попередньо вибитий) і тому для К-серії = 1. Для інших серій > 1; наприклад, для L-серії =7,5.
Відмітимо, що поява ліній К-серії супроводжується завжди випромінюванням інших серій, бо заповнення вакансії в К-шарі приводить до виникнення вакансій у вищих шарах. Зрозуміло, що формула Мозлі є наближеною. При точних вимірюваннях виявляється, що кожна спектральна лінія розщеплена на декілька, дуже близьких. Наприклад, лінія це дублет з двох ліній: і (мал. 7.16).
§7.10. Енергія молекул. Молекулярні спектри
Молекула, як система ядер і електронів, може здійснювати наступні рухи: поступальний, обертальний, коливальний, електронний, ядерний. Якщо в першому наближенні ці рухи вважати незалежними, то енергія молекул запишеться як
. (7.63)
Оскільки енергія поступального руху не квантується, то вона нас цікавити не буде. Ядерна енергія квантується, але відстані між ядерними енергетичними рівнями настільки великі (див. розділ 8), що у звичайних умовах енергія ядерного руху залишається незмінною. І тому в подальшому Епост та Еяд у виразі (7.63) опускатимемо.
7.10.1. При утворенні молекул з окремих атомів звязок між ними забезпечується не всіма електронами, але лише валентними. І тому зміна електронної енергії молекул зумовлена зміною стану валентних електронів. Обмежимось розглядом двохатомних молекул (наприклад, NaCl і H2). У випадку молекули NaCl атом Na легко іонізується і валентний електрон переходить до атома Cl. Таким чином, маємо справу з двома протилежно зарядженими іонами: Na+ і . Звязок в молекулах такого типу називають іонним або гетерополярним. Зрозуміло, що одночасно з силами кулонівського притягання існують і сили відштовхування між атомами (особливо сильні на малих відстанях). І тому потенціальна енергія взаємодії атомів в залежності від відстані має вигляд потенціальної ями.
У випадку молекули H2 обидва валентних електрони належать одночасно обом атомам (ядрам). Розвязок рівняння Шредінгера для такої системи (Гайтлер і Лондон, 1927р.) дає для електронної енергії молекули вирази
(7.64)
де Е0 енергія електрона в ізольованому атомі, К кулонівський інтеграл, який враховує попарну кулонівську взаємодію усіх частинок системи, S інтеграл перекриття, який враховує перекриття хвильових функцій обох електронів, А обмінний інтеграл, який враховує нерозрізняльність електронів, що ніби "належать" то одному, то іншому атому. Таким чином, електронний рівень ізольованого атому в молекулі зазнає розщеплення (рис. 7.17, а). При цьому кожному з розвязків (7.64) відповідає свій просторовий розподіл густини електронного заряду (рис. 7.17, б).
Оскільки за рахунок коливального руху атомів відстань між ними (R) змінюється, то слід очікувати залежність електронної енергії від R (рис. 7.18). Важливо відмітити, що стан з енергією Е реалізується при паралельній (↑↑) орієнтації спінів електронів, а стан з енергією Е+ - при антипаралельній (↑↓) орієнтації спінів. Зрозуміло, що тільки залежність Е(R) з мінімумом відповідає стійкому стану молекули. Звязок в молекулах, який забезпечується антипаралельними (спареними) спінами електронів, називають ковалентним або гомеополярним.
7.10.2. Розглядаючи двохатомну молекулу як квантовий лінійний гармонічний осцилятор (§7.5), енергію коливального руху молекули запишемо як
, (7.65)
де = 0,1,2, … коливальне квантове число.
Кожний електронний рівень (електронна конфігурація) має свою сукупність коливальних рівнів (рис. 7.19). Формула (7.65) справедлива лише при малих значеннях , коли крива Е(R) близька до параболи. При великих інтенсивностях коливального руху (великих ) потрібно врахувати відхилення від гармонічності (ангармонізм), і енергія коливального руху молекули запишеться як
,
де γ коефіцієнт ангармонічності. Зрозуміло, що в цьому випадку коливальні енергетичні рівні вже не є еквідистантними, а згущуються.
7.10.3. Енергія обертального руху двохатомної молекули
(7.66)
де I момент інерції молекули відносно осі обертання, що перпендикулярна до лінії, яка сполучає атоми, і проходить через центр молекули; - кутова швидкість обертання молекули; момент імпульсу молекули. Останній квантується так, як і орбітальний момент імпульсу електрона в атомі (7.48), тобто
(7.67)
де J = 0,1,2,3, … обертальне квантове число.
Підставивши (7.67) у (7.66), отримаємо
. (7.68)
Момент інерції молекули розраховується як
,
де зведена маса молекули, атоми якої мають маси m1 та m2 ; d відстань між центрами атомів.
7.10.4. Підставляючи у (7.63) вирази (7.65) і (7.68), отримаємо повну енергію молекули (в гармонічному наближенні):
. (7.69)
При цьому між енергіями різних форм руху молекули мають місце наступні нерівності: . Енергетична діаграма, які відповідає виразу (7.69), для двох електронних конфігурацій представлена на рис. 7.20. Видно, що для відстаней між енергетичними рівнями різних форм руху також мають місце нерівності: Якщо певним (тепловим, оптичним тощо) чином перевести молекулу в збуджений стан, то при переході на нижчі рівні будуть випромінюватись кванти світла різної енергії. Але, як правило, досліджуються не спектри випромінювання, а спектри поглинання. Зумовлено це тим, що при помірних температурах молекули перебувають переважно у найнижчих електронних і коливальних станах. І тому спектри випромінювання мають мало ліній слабкої інтенсивності. Зрозуміло, що такі обмеження не поширюються на спектри поглинання, які формуються при переході з нижчих на вищі рівні під дією світла.
Розрізняють наступні типи спектрів поглинання молекул: обертальні (І), коливально-обертальні (ІІ) і електронно-коливально-обертальні (ІІІ) (рис. 7.20). Обертальні спектри виникають при переходах між обертальними рівнями молекули однієї електронно-коливальної конфігурації; при цьому виконуються правила відбору . Енергія поглинутих фотонів
(7.70)
а їх частота .
Остання формула дозволяє за експериментальними значеннями частот (довжин хвиль) обертального спектру визначати момент інерції молекул. Відмітимо, що обертальні спектри лежать у далекій інфрачервоній області ( = 10-410-3 м), на межі з ультрарадіодіапазоном.
Коливально-обертальні спектри формуються при переходах між обертальними рівнями молекули в різних коливальних конфігураціях, але однієї електронної конфігурації; при цьому виконуються наступні правила відбору: = 1, J = 1. Енергія поглинутих фотонів (для малих , коли справедлива формула(7.65))
(7.71)
а частота .
Такий спектр являє собою смугу близьких ліній, розміщених симетрично відносно уявної v0лінії, яка не реалізується. Зрозуміло, що остання формула дозволяє встановити як момент інерції молекули, так і частоту її власних коливань. Коливально-обертальні смуги лежать в середній ІЧ-області ( 10-5 м).
Електронно-коливально-обертальні спектри поглинання формуються при переходах між обертальними рівнями молекули в різних електронних конфігураціях; при цьому виконуються правила відбору: = 1, J = 0, 1. Отже, кожній парі електронних рівнів відповідає група смуг коливально-обертального спектру. Ці смуги лежать як у близькій ІЧ-області, так і у видимій області ( 10-6 м).
§7.11. Люмінесценція
З точки зору квантової механіки випромінювання тіл зумовлене переходами атомів (молекул, кристалу) із збудженого стану в основний чи нижчий енергетичний стан. Характер випромінювання визначається способом переведення атомів (молекул, кристалу) в збуджений стан. Якщо збудження здійснюється тепловим шляхом, тобто нагріванням тіл, то випромінювання називається тепловим (рівноважним, температурним). Усі інші види збуджень супроводжуються випромінюванням, яке називається люмінесценцією. За С. Вавіловим, люмінесценція це оптичне випромінювання тіла, що є надлишковим над тепловим при цій же температурі в даному спектральному діапазоні; при цьому тривалість свічення перевищує 10-10 с, тобто не припиняється зразу ж після вимкнення збудження. Розрізняють два види люмінесценції: флуоресценцію, коли =10-910-8 с, і фосфоресценцію, коли > 10-8с.
Крім того, залежно від способу збудження, розрізняють такі види люмінесценції:
Серед усіх видів люмінесценції найважливішою є фотолюмінесценція, яка збуджується як видимим світлом, так і більш короткохвильовим. Стокс встановив, що довжини хвиль люмінесцентного випромінювання, як правило, більші від довжин хвиль збуджуючого випромінювання. Дійсно, енергія збуджуючого фотона hзб витрачається на створення «люмінесцентного» фотона з енергією hлюм і на різні процеси (в т. ч. теплові) неоптичного походження, тобто
,
звідси: зб > люм і зб < люм.
Важливою характеристикою фотолюмінесценції є квантовий вихід, як відношення числа Nл фотонів люмінесцентного випромінювання до числа Nз збуджуючих фотонів, тобто
Як правило, значення Вк залишаються постійними (і дещо меншим від одиниці) при малих довжинах хвиль збуджуючого випромінювання і різко падають до нуля, коли енергія збуджуючих фотонів стає недостатньою для переведення атомів речовини в збуджений стан (рис. 7.21). На вказаному рисунку також приведена спектральна залежність енергетичного виходу фотолюмінесценції Be відношення енергії люмінесцентного випромінювання до енергії збуджуючого світла, тобто
. (7.72)
Якщо припустити, що Вк = 1, то формула (7.72) запишеться як , з якої випливає лінійна залежність енергетичного виходу від довжини хвилі збуджуючого світла при малих зб.
Фотолюмінесценція та інші види люмінесценції спостерігаються в газах, рідинах і твердих тілах. Зокрема, штучні кристали (ZnS, CdS тощо), леговані певними домішками активаторами, які мають високий квантовий і енергетичний вихід люмінесценції, називаються кристалофосфорами (люмінофорами). В лампах денного світла реалізуються одночасно як катодолюмінесценція, так і фотолюмінесценція. Перший процес відбувається в газовому середовищі (пари руті) за рахунок бомбардування атомів електронами, прискореними електричним полем; при цьому виникає свічення як видимого, так і ультрафіолетового (переважно) діапазонів. Стінки лампи покриті шаром люмінофору, який люмінесціює під впливом УФ-випромінювання. При цьому спектральний склад фотолюмінесцентного випромінювання близький до випромінювання Сонця.
§7.12. Поглинання, спонтанне і вимушене випромінювання. Квантові генератори
7.12.1. Раніше (§6.10) ми розглянули класичну теорію взаємодії світла з речовиною, яка ґрунтувалась на уявленнях про вимушені коливання електронів атомів під дією змінного електричного поля світлової (електромагнітної) хвилі. Тут же цю задачу розглянемо з точки зору квантової механіки в рамках дворівневої моделі, яка передбачає, що атоми речовини можуть перебувати в двох стаціонарних станах з енергіями En і Em (рис. 7.22), при цьому m-стан будемо вважати основним (мінімальна енергія), а n-стан збудженим. При абсолютному нулі всі атоми перебувають в основному стані, а при T > 0 концентрація атомів в різних станах, у відповідності з розподілом Больцмана для ідеального газу,
де k0 постійна Больцмана, а константа C шукається з умови де N загальна кількість атомів речовини. Звідси
. (7.73)
Зрозуміло, що при T > 0 завжди , тобто заселеність рівнів тим менша, чим вища енергія.
Нехай система атомів перебуває в рівновазі з електромагнітним випромінюванням, обємна густина енергії якого wv, а енергія квантів . Тоді за А.Ейнштейном (1916 р.) в такій системі можливі три типи переходів:
Інтенсивність таких переходів, тобто кількість переходів в одиниці обєму за одиницю часу, зрозуміло, пропорційна до кількості атомів у вихідному стані (Nm чи Nn),а також до густини енергії зовнішнього випромінювання (для вимушених переходів 1 та 3). І тому
для переходів 1: , (7.74а)
для переходів 2: , (7.74б)
для переходів 3: , (7.74в)
де коефіцієнти Ейнштейна; при цьому .
Важливо відмітити, що «вимушені» (вторинні) фотони мають таку ж частоту, фазу, поляризацію і напрямок руху, як і «вимушуючі» (первинні) фотони.
За принципом детальної рівноваги інтенсивність переходів 1 повинна дорівнювати сумарній інтенсивності переходів 2 і 3, тобто
. (7.75)
Підставляючи в цей вираз формули (7.74), після нескладних перетворень отримаємо
,
а з врахуванням (7.73), остаточний вираз для обємної густини енергії випромінювання, яке перебуває в рівновазі з атомною випромінюючою системою,
. (7.76)
Оскільки таку ізольовану систему можна розглядати як абсолютно чорне тіло, то його випромінювальна здатність пропорційна до густини енергії. І тому
, (7.77)
що з точністю до коефіцієнта пропорційності співпадає з формулою Планка (§6.11).
7.12.2. Порівняємо інтенсивності двох вимушених переходів в рівноважному стані: поглинання світла (nm) і вимушеного випромінювання (mn):
(7.78)
Оскільки інтенсивність поглинальних переходів перевищує інтенсивність випромінюючих переходів, то в цілому світловий промінь, що взаємодіє з системою, буде поглинатись у відповідності з законом Бугера для інтенсивності світла
,
де коефіцієнт поглинання > 0.
Зрозуміло, що в такій системі можна здійснити підсилення світла (відємне поглинання з < 0), якщо б реалізувалось інверсне заповнення рівнів, тобто Nn > Nm. Формально це можливо при T < 0 у формулі (7.78). В рівноважних умовах таку ситуацію в дворівневій моделі (рис. 7.22) реалізувати не можна. Практично інверсний стан середовища здійснюється в квантових генераторах оптичного діапазону (лазерах) і сантиметрового діапазону (мазерах), з використанням трирівневої моделі (рис. 7.23), яка реалізується, наприклад, в кристалі рубіну окисі алюмінію Al2O3 з домішкою Cr+3.
Іони хрому можуть перебувати в трьох станах: Е1 основний стан, Е2, Е3 збуджені стани. Випромінювання ксенонової лампи (лампи накачки) переводить іони в збуджений стан Е3 (перехід В13); час життя в цьому стані складає 10-8 с. Менша частина іонів спонтанно переходить в основний стан (перехід А31), випромінюючи фотони, але більша частина іонів безвипромінювально переходить в стан Е2, який є метастабільним, бо в ньому час життя складає 10-3 с, тобто на 5 порядків перевищує час життя в звичайному збудженому стані. За рахунок цього здійснюється інверсна заселеність рівнів, тобто N2 > N1. Середовище з інверсною заселеністю називається активним. Навіть випадковий фотон, породжений при спонтанному переході А21, викликає лавину вимушених переходів В21. Вторинні фотони за частотою і фазою, а також напрямком поляризації співпадають з первинним фотоном. Дзеркала, розміщені на торцях активного середовища (одне з них напівпрозоре) сприяють розмноженню лавин одного напрямку, перпендикулярного до площини дзеркал. І тому лазерне випромінювання характеризується дуже малим кутовим розходженням, високою монохроматичністю ( 0,1Å), строгою когерентністю, а також великою потужністю.
Вказані властивості забезпечують практичне використання лазерних технологій: запис і передача інформації в земних і космічних умовах, обробки матеріалів, точна метрологія, в т.ч. геодезична, безкровна хірургія, голографія тощо.
§7.13. Теплові коливання кристалічної решітки і теплоємність твердих тіл
7.13.1. Більшість твердих тіл володіють кристалічною структурою, тобто є сукупністю великого числа атомів, впорядковано розміщених в просторі, і які тим самим утворюють кристалічну решітку. Оскільки атоми, що перебувають в сусідніх вузлах кристалічної решітки, зазнають взаємного притягання і відштовхування, то потенціальна енергія взаємодії між ними має вигляд потенціальної ями (рис.7.24).
В рамках класичної фізики при атоми повинні перебувати на дні потенціальної ями, на відстані r0 один від одного. І, звичайно, бути нерухомими. З підвищенням температури енергія атомів зростає, і кожен атом починає здійснювати коливний рух відносно рівноважного положення між точками А і В. При дуже низьких температурах ці коливання можна вважати гармонічними, бо залежність Ер(r) приблизно параболічна. При вищих температурах, як видно з рис. 7.24, зявляється асиметрія відхилень від рівноважного положення r0: коливання стають ангармонічними. За рахунок ангармонізму середня відстань між атомами (штрих-пунктир) з ростом температури збільшується має місце теплове розширення твердих тіл.
Оскільки три взаємноперпендикулярні напрямки коливань є рівноправними, то можна вважати, що атом у кристалічній решітці володіє трьома коливальними ступенями вільності (і = 3). Якщо знехтувати ефектом ангармонізму, то теплові коливання окремого атома можна моделювати сукупністю трьох незалежних лінійних осциляторів. Будемо вважати коливання окремих атомів незалежними. Тоді для одного моля речовини кількість ступенів вільності коливального руху складатиме 3NA, де NA число Авогадро. В класичній фізиці на одну ступінь вільності коливального руху припадає енергія k0Т, де k0 постійна Больцмана. Отже, внутрішня енергія моля твердого тіла
, (7.79)
де R універсальна газова стала.
Молярна теплоємність тіла
. (7.80)
Такий результат (закон Дюлонга-Пті) підтверджується експериментально для багатьох простих кристалічних речовин при високих температурах. Але при низьких температурах експеримент (рис.7.25) і класична теорія катастрофічно розходяться. Зокрема, при дуже низьких температурах виконується “закон кубів Дебая” , у відповідності з яким .
7.13.2. Першу спробу узгодити експеримент з теорією здійснив А. Ейнштейн (1907 р.), який залишивши тезу про незалежність осциляторів, запропонував вважати останні не класичними, а квантовими. Як показано в §7.5, енергія квантового лінійного осцилятора
.
Ейнштейн припустив, що всі осцилятори коливаються з однаковою частотою , а їх розподіл за енергією описується класичною функцією розподілу Максвелла-Больцмана
,
де N0 загальна кількість осциляторів, а кількість осциляторів, коливна енергія яких складає . Тоді середня енергія одного осцилятора, тобто енергія, що припадає на одну ступінь вільності,
. (7.81)
Після математичних перетворень останній вираз запишеться як
. (7.82)
Внутрішня енергія одного моля твердого тіла
,
а молярна теплоємність
. (7.83)
При високих температурах, коли k0Т>>h, формула (7.83) дає , тобто закон Дюлонга-Пті. При низьких температурах, коли k0Т<<h, отримаємо
. (7.84)
Оскільки експоненційна залежність сильніша від степеневої, то (7.84) дає зменшення теплоємності з пониженням температури, що лише якісно узгоджується з експериментом (рис. 7.25), але не забезпечує кількісно виконання “закону кубів Дебая”. Для розділення областей високотемпературного і низькотемпературного наближень вводиться характеристична температура Ейнштейна E, при якій k0E = h; звідси . Отже, при T >> E виконується закон Дюлонга-Пті; при T << E виконується залежність (7.84).
7.13.3 Подальше удосконалення теорії, здійснене Дебаєм (1912 р.), полягає в тому, що коливання атомів кристалічної гратки вже не вважаються незалежними, а в кристалі встановлюється система т.з. нормальних коливань з частотою від 0 до ; при цьому в коливанні певної частоти беруть участь усі атоми ґратки. Розрахунок дає для кількості нормальних коливань, частоти яких лежать в межах від до +d, в одному молі речовини
. (7.85)
Поява максимальної частоти зумовлена тим, що загальна кількість нормальних коливань повинна дорівнювати кількості ступенів вільності коливного руху атомів моля кристалу, тобто
Розглядаючи кожне нормальне коливання як квантовий лінійний осцилятор, для внутрішньої енергії одного моля кристалу отримаємо
,
а після підстановки формул (7.81) та (7.85) і математичних перетворень
. (7.86)
Ввівши підстановку , отримаємо вираз для молярної теплоємності кристалу
. (7.87)
За аналогією з попереднім введемо характеристичну температуру Дебая Д, використавши співвідношення ; звідси
.
Оскільки , то (7.87) після інтегрування набуде вигляду
.
При високих температурах (Т >> Д), коли x0, використавши наближення , отримаємо , тобто закон Дюлонга-Пті. При низьких температурах (Т << Д), коли xmax, отримаємо “закон кубів Дебая”
, (7.88)
який кількісно узгоджується з експериментом (рис.7.25).
В рамках концепції корпускулярно-хвильового дуалізму речовини зміну енергії коливного руху кристалічної гратки можна описати процесами випромінювання чи поглинання особливої квазічастинки фонона, який володіє нульовим спіном і тому належить до класу бозонів (§7.7) .
§7.14. Елементи зонної теорії твердих тіл
7.14.1. При утворенні кристалічної решітки твердих тіл, тобто при зближенні окремих атомів до відстані , атомні енергетичні рівні повинні розщеплюватись в зони рівнів, оскільки принцип Паулі тепер стосується не окремих атомів, а кристалічної решітки в цілому. Розщеплення тим сильніше, чим менша відстань між атомами і чим вищий енергетичний рівень (рис. 7.26 а). Таким чином, шкала енергій електронів в кристалічній решітці розбивається на зони дозволених енергій і зони заборонених енергій (на рис. 7.26 б заштриховані зони дозволених енергій, які відповідають рівноважній відстані між атомами R0).
Кількість енергетичних рівнів в зонах співмірна з кількістю атомів речовини, тобто . Оскільки ширина зон , то відстань між окремими рівнями , що значно менше від енергії теплового руху k0Т. І тому можна вважати розподіл енергій в зонах неперервним.
У відповідності з принципом Паулі на кожному енергетичному рівні в зонах може перебувати не більше двох електронів з протилежними спінами. Якщо зона утворена з повністю заповненого електронами атомного рівня, то всі рівні такої зони також повністю заповнені. Зрозуміло, що це стосується зон, утворених з глибоких атомних рівнів. Електрони таких зон не можуть брати участь в електричних і теплових явищах, бо ні енергія електричного поля, ні теплова енергія не є достатніми для переводу електрона в сусідню вищу зону, а переходи в межах заповненої зони неможливі.
Інша ситуація в зонах, утворених з частково заповнених рівнів, тобто рівнів валентних електронів. Зрозуміло, що такі зони будуть заповнені також частково. Для прикладу розглянемо зону, утворену з атомного s-рівня, на якому перебуває лише один (валентний) електрон (Li, Na, K тощо). Якщо кристалічна решітка утворена з N атомів, то вказана зона має N рівнів, на яких може розміститись 2N електронів. Оскільки валентних електронів лише N, то заповниться лише половина зони (рис. 7.27 а). А це означає, що під впливом зовнішнього збудження (тепло, електричне поле) електрони можуть вільно переходити на вищі рівні в межах однієї зони, тим самим збільшувати свою енергію, тобто прискорюватися. Отже, електрони в частково заповненій зоні є носіями струму. Тому така зона, яку ми назвемо валентною, є одночасно зоною провідності. В залежності від характеру заповнення валентної зони всі тверді тіла поділяються на метали, з одного боку (рис. 7.27 а), і напівпровідники та діелектрики, з іншого (рис. 7.27 б). В металах валентна зона (v-зона) заповнена частково, всі вищі зони порожні, всі нижчі зони заповнені повністю. В напівпровідниках і діелектриках v-зона заповнена повністю (при Т = 0) і тому не може бути зоною провідності. Наступна вища зона при Т = 0 повністю порожня. Ця зона називається зоною провідності (c-зоною), бо при певних умовах (Т 0) в ній можуть зявитися електрони, які будуть носіями струму. Енергетична відстань між дном c-зони (Ес) і стелею v-зони (Еv) називається забороненою зоною Еg = Ec Ev. Якщо Еg < 2,5eB, то речовина напівпровідник, якщо Еg > 2,5eB, то діелектрик.
Появу носіїв струму в напівпровідниках пояснимо, використавши плоску модель кристалічної решітки атомного напівпровідника, наприклад, Ge (рис.7.28). Такий напівпровідник має тетраедричну кристалічну структуру, при якій кожен атом оточений чотирма сусідами. Звязок між сусідніми атомами забезпечується двома валентними електронами з протилежними спінами. При Т = 0 всі валентні електрони перебувають на звязках, “зайвих” електронів немає, що відповідає повністю заповненій валентній зоні і порожній зоні провідності.
При нагріванні кристалу деякі електрони за рахунок енергії теплового руху можуть вийти із звязків, стати вільними і в електричному полі напруженістю набути швидкості напрямленого руху . На звільнене вакантне місце може перейти електрон із сусіднього звязку, що рівнозначне рухові дірки (hole) в протилежному напрямку зі швидкістю . Оскільки дірка рухається за полем (електрон проти поля), то дірку слід розглядати як позитивний заряд +е. На енергетичній діаграмі теплова генерація вільних електронів і дірок зображається як перехід електрона з v-зони у c-зону (рис.7.29). Зрозуміло, що чим вища інтенсивність теплового збудження (чим вища температура), тим вища концентрація електронів (n) і дірок (р) у відповідних зонах. Відмітимо, що ця концентрація не перевищує, як правило, 0,1% від кількості енергетичних рівнів в зонах. Отже, електрони є носіями струму в майже порожній зоні провідності, а дірки в майже повністю заповненій валентній зоні.
Енергія вільного електрона
, (7.89)
де р імпульс електрона.
В багатьох випадках для опису енергії електронів в металах і напівпровідниках можна користуватись цією ж формулою, але ввівши замість маси електрона m0 ефективну масу , яка може бути як більшою, так і меншою m0, і яка враховує взаємодію зонних електронів з полем кристалічної гратки. Аналогічно вводиться і ефективна маса зонних дірок . І тому енергії електронів і дірок виражаються через їх імпульси наступним чином
(7.90)
де відлік енергії ведеться від краю відповідної зони: вверх від Ес для електронів і вниз від Еv для дірок. Співвідношення (7.90) називаються законами дисперсії для зонних носіїв струму.
§7.14.2. Розподіл частинок з напівцілим спіном (ферміонів), в т.ч. і електронів, за енергіями описується квантовою функцією розподілу Фермі-Дірака
, (7.91)
де f(E) імовірність перебувати електрону на рівні з енергією Е, а F енергія (рівень) Фермі. Зміст останньої зрозумілий з аналізу f(E) при Т = 0. Якщо Е > F, то f (Е) = 0, тобто рівень порожній; якщо Е < F, то f (E) =1, тобто рівень заповнений. Отже, енергія Фермі відповідає найвищому рівню, який ще заповнений при Т = 0 (рис. 7.30). При Т > 0 f(E) = 1/2, якщо Е=F, тобто енергія Фермі відповідає рівню, який при ненульовій температурі заповнений наполовину (рис. 7.30).
При певних умовах, а саме, коли Е - F >> k0Т, квантовий розподіл Фермі-Дірака переходить в класичний розподіл Максвелла-Больцмана
. (7.92)
Електронний газ, що описується таким розподілом, називається невиродженим газом. В цей же час електронний газ, що описується розподілом Фермі-Дірака, називається виродженим. Критерієм виродження є нерівність
, (7.93)
тобто виродження має місце при високій концентрації електронів, малій їх ефективній масі та низьких температурах. В металах електронний газ завжди вироджений (n 1022 см-3), в напівпровідниках, як правило, невироджений (n < 1018 см-3).
В металах при низьких температурах концентрація електронів зони провідності, енергія яких лежить в інтервалі , складає
де dg(E) кількість енергетичних рівнів у вказаному інтервалі. Якщо справедливий параболічний закон дисперсії (7.90), то нескладний розрахунок дає
.
Тоді повна концентрація носіїв у с-зоні металу при низьких температурах
(7.94)
і від температури не залежить. Енергія Фермі
,
що дає при . Середня енергія зонних електронів в металах , що значно більше від k0Т.
А це означає, що лише незначна кількість електронів, що перебувають на рівнях, близьких до рівня Фермі, може змінити свою енергію при зміні температури. Таким чином, електронний газ в металах практично не вносить вкладу в теплоємність кристалу (див. §7.13), незважаючи на високу загальну концентрацію електронів.
В напівпровідниках рівень Фермі, як правило, лежить в забороненій зоні (рис.7.29), і тому при розрахунку концентрації невироджених електронів в зоні провідності потрібно врахувати, що функція розподілу (7.92) в усьому діапазоні енергій Е > Ec менша від одиниці і залежить від температури. І тому
,(7.95)
де Аn множник, який слабо залежить від температури і визначається ефективною масою носіїв, а Еg ширина забороненої зони.
Як слідує з (7.95), з ростом температури концентрація зонних (вільних) електронів збільшується за експоненційним законом. Ця формула справедлива лише для бездомішкового, т.з. власного, напівпровідника. Зрозуміло (див. рис. 7.29), що концентрація дірок у валентній зоні дорівнює концентрації електронів в зоні провідності: n = p = ni власна концентрація носіїв струму.
Ситуація радикально змінюється, коли в напівпровідник ввести домішки. Зокрема, коли вводяться донорні домішки, тобто домішки, які легко віддають електрони в c-зону, то n >> p; такий домішковий напівпровідник називається електронним (n-типу). Якщо ж вводяться акцепторні домішки, тобто домішки, які легко захоплюють електрони з v-зони, то p >> n; такий домішковий напівпровідник називається дірковим (р-типу). В класичних напівпровідниках Ge i Si в ролі донорних домішок виступають As, P, а акцепторних Ga, Іn.
Оскільки енергія іонізації донорів та акцепторів значно менша від ширини забороненої зони, то енергетичні рівні цих домішок розміщені в забороненій зоні на відстані енергії іонізації (Д, А) від дна зони провідності чи вершини валентної зони, відповідно (рис. 7.31). При низьких температурах, коли іонізація домішок є слабкою, а власна генерація носіїв несуттєва, концентрація носіїв в зонах запишеться:
для n-типу: , (7.96)
для p-типу: , (7.97)
де Bn і Bp множники, які слабо залежать від температури, а визначаються концентрацією відповідних домішок і ефективною масою носіїв струму. Отже, і в цьому випадку концентрація носіїв збільшується експонеційно з ростом температури кристалу. Відмітимо, що рівень Фермі в домішкових напівпровідниках розміщений біля країв відповідних зон (рис. 7.31).
§7.15. Електропровідність металів і напівпровідників
Відомо (розділ 3), що густина електричного струму в провідниках (металах, напівпровідниках, електролітах тощо) визначається зарядом носіїв, їх концентрацією n та середньою швидкістю напрямленого (дрейфового) руху , зумовленого електричним полем напруженістю . Якщо носіями струму є електрони, то густина струму
(7.98)
В слабких електричних полях, де виконується закон Ома, швидкість напрямленого руху лінійно залежить від напруженості електричного поля, тобто
, (7.99)
де рухливість електронів.
Підставляючи (7.99) у (7.98), отримаємо
, (7.100)
тобто закон Ома в диференційній формі, де
(7.101)
питома електропровідність електронного провідника (металу, напівпровідника n-типу).
Питома електропровідність власного напівпровідника
, (7.102)
де рухливість дірок.
Рухливість носіїв визначається так званим часом релаксації , який формально можна розглядати як проміжок часу між двома послідовними актами зіткнення (розсіяння) носіїв з недосконалостями кристалу. Основними недосконалостями (відхиленнями від ідеальності) є коливання кристалічної решітки (фонони) і домішки кристалу. В рамках вказаного формалізму середній час релаксації носіїв
, (7.103)
де середня довжина вільного (між двома послідовними зіткненнями) пробігу носіїв, середня швидкість теплового (хаотичного) руху носіїв.
Строга квантова теорія дає
. (7.104)
Підставляючи (7.104) у (7.101), отримаємо для питомої електропровідності
. (7.105)
Оскільки в металах концентрація носіїв (електронів у c-зоні) від температури не залежить, то залежність питомої електропровідності визначається лише відношенням . Виявляється, що, за винятком дуже низьких температур, . І тому , а питомий опір , у відповідності з відомим експериментальним законом . Відмітимо, що при оціночних розрахунках можна покладати .
Принципово інша ситуація в напівпровідниках, де концентрація носіїв експоненційно залежить від температури (7.957.97). Рухливість носіїв в напівпровідниках також залежить від температури, але за значно слабшим, степеневим законом
,
де при різних температурах приймає значення від 1,5 до + 1,5. Підставляючи (7.957.97) у (7.101; 7.102), отримаємо вирази для питомої електропровідності:
власного (n=p) напівпровідника,(7.106)
домішкового n-типу (7.107)
домішкового p-типу , (7.108)
де передекспоненційні множники можемо наближено вважати від температури незалежними. Формули (7.106 7.108) можна узагальнити у вигляді
, (7.109)
де енергія активації провідності, яка у власному напівпровіднику дорівнює , а у домішкових напівпровідниках має зміст половини енергії іонізації донорів чи акцепторів. Отже, питома електропровідність напівпровідників експоненційно збільшується з ростом температури, чим останні принципово відрізняються від металів.
Температурна залежність питомого опору напівпровідникового кристалу, як випливає з (7.109),
(7.110)
або
В широкій області температур експериментальна залежність (рис. 7.32) має три ділянки: 1 домішкової провідності; 2 повної іонізації домішок (n = [Д] для кристалу n-типу); 3 власної провідності.
§7.16. Напівпровідникові структури
7.16.1. Однорідні напівпровідникові кристали використовують для виготовлення серії приладів: терморезисторів, фоторезисторів, тензодатчиків, де реалізується залежність опору кристалу від температури, освітленості, зовнішнього тиску. Але значно ширше використовуються прилади (діоди, транзистори, фотодіоди, світлодіоди, лазери, мікросхеми, процесори ЕОМ тощо), виготовлені з використанням напівпровідникових структур: електронно-діркових переходів(p-nпереходів) і барєрів Шоткі. Зокрема, барєр Шоткі це контакт металу і напівпровідника із спеціально підібраними роботами виходу електронів з них. Електронно-дірковий перехід це контакт двох областей одного кристалу з різними типами провідності (p- і n-) (рис. 7.33)
Основними носіями в p-області є дірки з концентрацією p, в n-області електрони з концентрацією n. В цей же час у цих областях є і неосновні носії: електрони в p-області з концентрацією np і дірки в n-області з концентрацією pn. Оскільки повинні виконуватись співвідношення , а в симетричному p-n-переході і p = n, то мають місце нерівності
.
Таким чином, на границі областей реалізується сильний градієнт концентрацій електронів і дірок, що викликає дифузію електронів з n-області в p-область і дірок з p-області в n-область. Ці дифузійні потоки описуватимемо як дифузійний струм основних носіїв з густинами та (рис. 7.33). В обємі областей локальна нейтральність забезпечується виконанням рівностей і (рис. 7.31). В приконтактних областях нейтральність порушується: приконтактний шар p-області заряджається негативно (заряд нескомпенсованих акцепторів), а приконтактний шар n-області заряджається позитивно (заряд нескомпенсованих донорів). Отже, виникає контактне електричне поле у вигляді подвійного зарядженого шару. Це поле перешкоджає подальшій дифузії основних носіїв, тобто виникає для них потенціальний барєр висотою . До такого ж результату
можна прийти і з термодинамічних міркувань. Дійсно, рівновага між областями настане, коли вирівняються енергії Фермі в обох областях: . Якщо на рис. 7.31 енергетичну діаграму p-типу зафіксувати (умовно заземлити p-область), то енергетичну діаграму n-типу потрібно опустити так, щоб вирівнялась енергія Фермі. А це призведе до викривлення зон і виникнення барєру (рис. 7.33).
Оскільки в області контактного поля рівень Фермі розміщений посередині забороненої зони, що відповідає власному напівпровіднику, то концентрація носіїв в цій області дуже мала , а значить, опір дуже великий. І тому ця область називається запірним шаром. Ширина цього шару
тим менша, чим сильніше леговані n- і p- області: .
Густина дифузійних струмів основних носіїв визначаються висотою потенціального барєру:
. (7.111)
В цей же час для неосновних носіїв барєру немає; більш того, контактне поле прискорює ці носії, викликаючи дрейфові струми неосновних носіїв густиною . Густина дрейфового струму лінійно залежить від напруженості контактного поля (закон Ома), тобто значно слабше від експоненційної залежності для густини дифузійного струму. І тому дрейфові струми наближено можна вважати постійними. Оскільки вектори густин дифузійного і дрейфового струмів напрямлені протилежно, то повний струм через p-n-перехід в рівноважних умовах дорівнює нулю, тобто
.
7.16.2. Прикладемо до p-n-стуктури зовнішню наругу так, як показано на рис. 7.34; таке ввімкнення називається прямим. В цьому випадку напруженість зовнішнього поля напрямлена протилежно до , і тому напруженість результуючого поля зменшиться, потенціальний барєр понизиться на і стане рівним . Якщо p-область вважати умовно заземленою, то рівень Фермі в n-області підніметься на .
У відповідності з (7.111) густини дифузійних струмів основних носіїв зростуть і стануть рівними
(7.113)
Одночасно з тим p-область збагатиться додатковими неосновними носіями (електронами), а n-область дірками. Має місце інжекція неосновних носіїв струму. Оскільки густина дрейфового струму неосновних носіїв через p-nперехід залишається практично незмінною (рівноважною), то густина повного струму
. (7.114)
Врахувавши, що , після підстановки (7.111) та (7.113) отримаємо густину прямого струму
(7.115)
де сумарна густина дрейфового струму неосновних носіїв.
Експоненційний ріст прямого струму з ростом Uз має місце до тих пір, доки Uз < 0. Якщо ж Uз ≥ 0, барєр на p-n-переході зникає, і залежність струму від напруги стає лінійною, у відповідності з законом Ома.
Якщо прикласти до p-n-структури зовнішню напругу так, як показано на рис. 7.35, то таке ввімкнення називається зворотним. У цьому випадку напрямки контактного і зовнішнього полів співпадають, результуюче поле збільшиться, барєр зросте на еUз і стане рівним е(Uз + 0). При практично незмінному дрейфовому струмі неосновних носіїв струм основних носіїв зменшиться. І через p-n-перехід протікатиме слабкий зворотний струм з густиною
. (7.116)
Формули (7.115) та (7.116) можна обєднати і користуватися лише першою, вважаючи пряму напругу додатною, а зворотну відємною. Вольт-амперна характеристика p-n-переходу, у відповідності з (7.115), матиме вигляд, показаний на рис. 7.36. Оскільки при кімнатній температурі , то вже при зворотній напрузі зворотний струм насичується і його густина стає рівною , а відношення при вказаній напрузі перевищує три порядки. Отже, p-n-перехід (напівпровідниковий діод) забезпечує пропускання струму лише в одному напрямку, тобто випрямляє змінний струм.
Розділ 8. Фізика ядра та елементарних частинок
Поняття про ядро атома як центральну позитивно заряджену масивну частину атома, навколо якої рухаються електрони, ввів Е.Резерфорд (1911 р.) на основі своїх дослідів по розсіянню -частинок речовиною. Позитивний заряд ядра чисельно рівний сумі негативних зарядів електронів нейтрального атома. За обрахунками Резерфорда радіус ядра rя ~ 10-15м (радіус атома rа ~ 10-10м). Плідність ядерної моделі атома проілюструвала теорія атома водню Н.Бора (1913 р.). Після того як Г. Мозлі (1913 р.) експериментально показав, що позитивний заряд ядра
, (8.1)
де Z порядковий номер елемента в таблиці Менделєєва, а е елементарний електричний заряд, чисельно рівний зарядові електрона (е = 1,6·10-19 Кл.), уявлення про ядро атома стало загальноприйнятим.
В ядерній фізиці за одиницю заряду приймають елементарний заряд е, а за одиницю маси атомну одиницю маси (а. о. м.). 1 а. о. м. рівна маси нукліда вуглецю . Очевидно,
,
де число Авогадро. В таких одиницях Q = Z (Z називають зарядовим числом ядра), а маси атомів різних елементів виражаються числами, близькими до цілих. Заокруглена до найближчого цілого маса атома даного елемента, виражена в а. о. м., називається масовим числом елемента А.
Зарядове число Z і масове число А є основними характеристиками будь-якого ядра, тому ядро даного елемента позначається хімічним символом цього елемента з індексами Z та А (). Наприклад, ядро атома водню позначається . Цю частинку Резерфорд (1919 р.) назвав протоном ( або ). Оскільки маса електрона , електрон позначають .
Спочатку була запропонована протонно-електронна модель будови ядра, згідно з якою ядро складається з А протонів і А Z електронів. Однак ця гіпотеза зустрілась з труднощами, однією з яких виявилась так звана «азотна катастрофа» неможливість пояснити в рамках цієї гіпотези одиничний спін ядра азоту (в одиницях ). Спін цього ядра, яке містило б непарне число протонів і електронів (21), мав би бути напівцілим. Крім того, зі співвідношення невизначеностей випливає, що електрони не можуть входити до складу ядра, бо їх швидкість там була б більшою від с.
У 1932 р. Дж. Чедвік відкрив нову нейтральну елементарну частинку нейтрон (n або ). Д.Д. Іваненко і С.М. Гапон (1932 р.) висунули гіпотезу, що ядро атома складається з нуклонів протонів і нейтронів. Ця гіпотеза була розвинена В. Гейзенбергом і дістала пряме дослідне підтвердження по розщепленню ядер на протони і нейтрони.
Детальне вивчення нуклонів показало, що протон стабільна елементарна частинка з зарядом +1 і масою Він має спін (в одиницях ) і магнітний момент , де так званий ядерний магнетон. Нейтрон нейтральна частинка з масою , спіном і магнітним моментом (знак мінус вказує, що магнітний і спіновий моменти нейтрона антипаралельні); , причому . У вільному стані нейтрон нестабільний, його середній час життя 15 хв.
У відповідності з нуклонною моделлю ядро містить А нуклонів, в тому числі Z протонів і N = A Z нейтронів. Отже, зарядове число Z, яке співпадає з порядковим номером елемента в таблиці Менделєєва, визначає кількість протонів у ядрі і кількість електронів у атомі. Масове число А визначає загальну кількість нуклонів у ядрі.
Ядра з однаковими Z називаються ізотопами, з однаковим А ізобарами, з однаковими N ізотонами, з однаковими Z і А (але різними періодами піврозпаду) ізомерами. Наприклад, протій , дейтерій , тритій є ізотопами водню; ядра , є ізобарами. Всього відомо понад 1500 різних ядер, які чим-небудь відрізняються; приблизно з них стабільні, решта радіоактивні.
В природі зустрічаються елементи з атомним номером Z від 1 до 92 (крім і ). Трансуранові елементи, починаючи з Z = 93, були одержані штучно шляхом різних ядерних реакцій. Згідно з сучасними уявленнями хімічні елементи виникли в процесі нуклеосинтезу на етапі зоряної еволюції Всесвіту. За час існування Землі (5·109 р.) трансуранові елементи із-за відносно малого часу життя не збереглися в земній корі. Елементи з 93-го по 101-й були одержані в основному реакторним шляхом. Елементи зі 102-го по 118-й були одержані шляхом бомбардування важких ядер іншими важкими ядрами. Межу періодичної системи елементів повинна визначати нестабільність відносно спонтанного поділу надважких ядер.
Слід враховувати, що сукупність А нуклонів ядра не є класичною статичною системою, це суто квантова динамічна система. Кожний нуклон, крім спіну , внаслідок руху має орбітальний момент імпульсу , отже, і повний момент імпульсу , тому повний момент імпульсу (спін) ядра . Ця величина квантується за законом , де спінове ядерне квантове число, що пробігає значення При парному А спін ядра цілий, при непарному А напівцілий. Спіни ядер не перевищують декількох одиниць: це свідчить, що спіни більшості нуклонів ядра компенсуються.
Зі спіном ядра звязаний його магнітний момент співвідношенням , де гіромагнітний множник для ядра. Магнітні моменти ядер зумовлені власними магнітними моментами нуклонів і орбітальним рухом протонів. Суттєво, що власні магнітні моменти нуклонів ядра не адитивні. Оскільки L квантується, μ також квантується, тому енергія магнітної взаємодії електрона з ядром набуває дискретних значень. Це приводить до виникнення надтонкої структури спектрів атомів, вивчення якої дає можливість визначати магнітні моменти ядер.
Крім магнітного моменту ядро має також електричний квадрупольний момент eQ, який характеризує відхилення розподілу заряду в ядрі від сферично-симетричного; Q коефіцієнт, що має розмірність площі. Для сферично-симетричного ядра Q = 0; якщо Q > 0, ядро витягнуте, якщо Q < 0 сплюснуте.
Ефективний радіус ядра виражається емпіричною формулою
, (8.2)
де r0 = (1,3 1,7) фермі (Ф); 1Ф = 10-15м. Це розміри тієї області, де проявляється дія ядерних сил. Як видно, обєм ядра пропорційний до кількості його нуклонів; тому густина ядерної речовини для всіх ядер однакова і є величиною .
Користуючись таблицею мас ізотопів легко пересвідчитись, що маса ядра завжди менша від суми мас нуклонів, з яких воно складається. Величину
(8.3)
називають дефектом маси ядра. Його існування зумовлене тим, що при обєднанні нуклонів в ядро виділяється енергія. Її можна розрахувати за формулою Ейнштейна
, (8.4)
де с швидкість світла у вакуумі. Очевидно, щоб розкласти ядро на невзаємодіючі нуклони, потрібно таку ж енергію затратити. Ця енергія
(8.5)
називається енергією звязку ядра.
Для практичних застосувань співвідношення (8.5) зручно записувати у вигляді
, (8.6)
де маса атома водню, а ma маса атома, ядро якого розглядається. При переході до наближеної формули (8.6) нехтують малою енергією звязку електронів; зручність цієї формули полягає у тому, що в довідниках наводяться не маси ядер , а маси атомів . На основі (8.4) можна пересвідчитись, що 1а.о.м. еквівалентна енергії 931,5 МеВ; тому, виражаючи фігурну дужку формули (8.6) в а.о.м., для енергії звязку ядра в МеВ одержують
. (8.7)
Очевидно, енергія звязку ядра характеризує міцність ядра. Зручно ввести в розгляд так звану питому енергію звязку (енергія звязку, що припадає на один нуклон). Розрахунки показують, що ця величина залежить від масового числа А елемента (рис.8.1).
Для легких ядер стрибкоподібно зростає до 6 7 МеВ, далі більш повільно зростає до максимального значення 8,7 МеВ для елементів з масовим числом А ~ 50 60, а тоді повільно зменшується для важких елементів (наприклад, для ). Аналіз кривої показує:
Величезна питома енергія звязку ядра свідчить, що між нуклонами в ядрі діють особливі сили, які значно переважають електромагнітну та гравітаційну взаємодію нуклонів. Ядерна взаємодія між нуклонами одержала назву сильної взаємодії. Ядерні сили характеризуються такими особливостями:
У 1934 р. І.Є. Тамм висунув гіпотезу, що сильна взаємодія повинна мати обмінну природу. По аналогії з електромагнітною взаємодією, яка квантовою електродинамікою описується як процес віртуального обміну електронів фотонами
, (8.8)
нуклони в ядрі повинні обмінюватись деякими віртуальними частинками з масою, відмінною від нуля. Дійсно, віртуальними називаються частинки, час життя яких менший того, що визначається співвідношенням невизначеностей
, (8.9)
де невизначеність енергії квантового стану, тривалість існування цього стану. Очевидно, радіус дії обмінних сил оцінюється величиною
,
тобто він може бути скінченим, якщо маса віртуальної частинки відмінна від нуля.
У 1935 р. Х. Юкава показав, що для пояснення величини ядерних сил слід припустити існування віртуальних частинок з масою у 200300 разів більшою від маси електрона. Віртуальна частинка може стати реальною, якщо їй надати достатньої енергії. Подібні частинки з масою у 1936 р. виявили К. Андерсон і С. Неддермайер в космічних променях; вони дістали назву мюонів (μ-мезонів). Проте, лабораторними дослідженнями було доведено, що мюони практично не взаємодіють з ядрами, тому не можуть бути носіями ядерних сил. У 1947 р. С. Поуелл і Дж. Оккіаліні виявили в космічних променях ще один тип мезонів, які назвали -мезонами (піонами). Вони і виявились носіями ядерних сил. Існують три типи піонів: . Заряд мезонів за абсолютною величиною рівний елементарному зарядові е, їх маси: , . Спін усіх мезонів S = 0, всі вони нестабільні; час життя , . В основному піони розпадаються за схемами:
де мюони, - мюонні нейтрино і антинейтрино, γ фотони.
За рахунок процесів:
, (8.10)
, (8.11)
, (8.12)
здійснюється обмін нуклонів віртуальними піонами, що приводить до сильної взаємодії нуклонів. Така модель підтверджується дослідами по розсіянню нейтронів на протонах. При проходженні пучка нейтронів через водень у пучку зявляються протони, які мають енергію і напрямок руху нейтронів; відповідне число нерухомих нейтронів виявляється в мішені. Природно припустити, що нейтрон, пролітаючи поблизу протона, захоплює віртуальний +-мезон. В результаті нейтрон перетворюється в протон, а протон, який втратив свій заряд, перетворюється в нейтрон (рис. 8.2).
На основі процесів (8.10), (8.11) можна також пояснити магнітні моменти протона і нейтрона. Відємний магнітний момент нейтрона зумовлений орбітальним рухом мезона у віртуальному стані нейтрона (8.11);. аномальний магнітний момент протона (більший від одного магнетона) зумовлений орбітальним рухом +мезона у віртуальному стані протона (8.10).
Незважаючи на пояснення природи ядерних сил, послідовна кількісна теорія ядра донині не побудована, бо являє собою громіздку квантову задачу багатьох тіл, в якій закон дії ядерних сил невідомий. Це спонукає йти по шляху створення моделей ядра, які, за рахунок введення певних параметрів, що підбираються в узгодженні з дослідом, дозволяють простими засобами описувати деяку сукупність властивостей ядра. Найбільш вживаними з них є краплинна та оболонкова моделі ядра.
Краплинна модель ядра (К.Вейцзеккер, Я.І.Френкель, Н.Бор, 19351939р.), базуючись на властивості насичення ядерних сил і молекулярних сил в рідині, уподібнює ядро до зарядженої краплини рідини. Це дозволило одержати напівемпіричну формулу для енергії звязку ядра і, зокрема, пояснити процеси поділу важких ядер.
Оболонкова модель ядра (М. Гепперт-Майєр, Х. Ієнсен, 19491950р.) базується на уявленні, що нуклони рухаються незалежно в усередненому центрально-симетричному полі. У звязку з цим виникають дискретні енергетичні рівні, які заповнюються нуклонами на основі принципу Паулі. Ці рівні групуються в оболонки, в кожній з яких може перебувати певне число нуклонів. Повністю заповнена оболонка є особливо стійким утворенням. Такими особливо стійкими (магічними) виявляються ядра, у яких число протонів Z або число нейтронів N рівні: 2, 8, 20, 28, 50, 82, 126. Ядра, у яких магічними є Z та N, називаються двічі магічними. Їх відомо пять: , вони особливо стійкі.
Відома також узагальнена модель ядра (О. Бор, Б. Моттельсон, 1952 1953 рр.), що є спробою синтезу двох попередніх. Проте, кожна з цих моделей не характеризує загальної поведінки ядер.
§8.3. Радіоактивність
8.3.1. Радіоактивність процес самовільного перетворення деяких (нестабільних) ядер в інші з випромінюванням часток. До радіоактивних перетворень відносяться: -розпад, -розпад (з випромінюванням електрона, позитрона чи захопленням орбітального електрона), спонтанний поділ важких ядер, протонна та нейтронна радіоактивність. Радіоактивність нестабільних ядер, які існують у природі (їх відомо ~ 300), називається природною (А.Беккерель, 1896 р.), а тих, що одержані шляхом ядерних реакцій (їх відомо ~ 1700), штучною (І. та Ф. Жоліо-Кюрі,1934 р). Обидва види радіоактивності підкоряються одному законові радіоактивного розпаду.
Із-за незалежності радіоактивних перетворень окремих ядер можна вважати, що кількість ядер dN, які розпадаються за проміжок часу dt, пропорційна до наявного числа ядер N і до величини проміжку часу dt, тобто
, (8.13)
де постійна розпаду, яка характеризує ймовірність розпаду кожного ядра за одиницю часу; знак мінус вказує, що число ядер зменшується з часом. Інтегруючи (8.13) при умові , одержуємо закон радіоактивного розпаду
. (8.14)
Він показує, що число радіоактивних ядер N, які не розпалися до моменту часу t, зменшується з часом експоненційно (рис.8.3).
Кількість ядер, які розпались за час t,
, (8.15)
Час Т, протягом якого розпадається половина початкової кількості ядер, називається періодом піврозпаду. Підставляючи у (8.15) t = T i , одержуємо
. (8.16)
Період піврозпаду відомих радіонуклідів змінюється в дуже широких межах: від 310-7с до 51015 років. Очевидно, величина має сенс середнього часу життя ядра, тому з (8.13) випливає
. (8.17)
Виявляється, що в процесі радіоактивного перетворення вихідного (материнського) ядра виникає дочірнє ядро, яке теж може бути радіоактивним. В результаті виникає ряд (сімейство) радіоактивних елементів, генетично звязаних між собою. Для природно-радіоактивних елементів відомо 3 таких ряди: ряд торію ряд урану ряд актиноурану ; ці елементи започатковують свої ряди, які закінчуються стабільними ізотопами свинцю (, , ). Для штучно-радіоактивних елементів відомий ряд нептунію (найбільш довгоживучий елемент ряду), який починається з плутонію і закінчується стабільним ізотопом талію
З часом у кожному радіоактивному сімействі встановлюється так звана вікова рівновага, при якій швидкості утворення і розпаду проміжних членів ряду зрівнюються, тобто
. (8.18)
Вікова рівновага встановлюється на протязі десяти періодів піврозпаду найбільш довгоживучого члена ряду. По мірі його розпаду загальний вміст членів ряду в земній корі повільно зменшується. Оскільки для нептунію період піврозпаду складає ~ середнього віку Землі, членів його ряду в природі немає, вони були одержані штучно. Для будь-якого іншого елемента його ряду, крім свинцю, для якого λ = 0. Тому через великі проміжки часу виникає стільки ядер свинцю, скільки розпадається ядер урану, тобто . Очевидно також, що . Виключаючи невідому початкову концентрацію ядер урану , одержуємо . Сучасна концентрація урану та свинцю в уранових рудах може бути виміряна експериментально, що для середнього віку Землі дає величину ~ 4,5109 років.
Вже перші дослідники природної радіоактивності (П. та М. Кюрі, Е. Резерфорд) виявили, що радіоактивна речовина є джерелом трьох видів випромінювань: -, - і -променів.
8.3.2. -промені являють собою потік ядер гелію ; -розпад відбувається за схемою
. (8.19)
Індекси дочірнього ядра встановлюються на основі законів збереження зарядового і масового чисел: зарядове чи масове число до реакції рівне сумі відповідних чисел після реакції. Звідси випливають так звані правила зміщення; зокрема, при -розпаді Z дочірнього ядра на 2, а А на 4 менші, ніж у материнського ядра; наприклад,
.
Енергія реакції -розпаду визначається на основі формули (8.7), де дефект маси реакції
. (8.20)
Ця енергія виділяється у вигляді кінетичної енергії продуктів реакції і розподіляється між -частинкою і дочірнім ядром у відношенні обернено пропорційному до їх мас (це можна показати на основі законів збереження енергії та імпульсу).
Певний радіоактивний елемент випромінює -частинки декількох чітко визначених груп. Це зумовлено тим, що дочірнє ядро може виникати не тільки в основному стані 1, але і в збуджених станах 2,3,… (рис.8.4). За час існування збуджених станів (10-8 10-15) с дочірнє ядро переходить у більш низький чи нормальний стан, випромінюючи -квант. Так виникають -промені, які, звичайно, супроводжують -розпад, хоча дочірнє ядро може звільнитись від надлишку енергії також іншими способами: випромінюючи яку-небудь частинку або іонізуючи атом (процес внутрішньої конверсії).
Процес -розпаду не можна пояснити на основі класичної механіки. Досліди показують, що з радіоактивних ядер випромінюються -частинки з енергією ~6 МеВ. В той же час -частинки з енергією ~8 МеВ не проникають в ядро. Ядро для -частинки є потенціальним барєром, висота якого U0 більша від енергії -частинки Е (рис. 8.5). Внутрішня сторона барєру зумовлена ядерними силами притягання, зовнішня силами кулонівського відштовхування. Явище стає зрозумілим на основі квантової механіки: -частинка виникає в момент радіоактивного розпаду ядра і долає барєр ядра за допомогою тунельного ефекту (для мікрочастинки існує відмінна від нуля ймовірність проникнути через барєр з енергією меншою від висоти барєру; Г. Гамов, 1928 р.).
Теорія -розпаду, що спирається на явище тунельного ефекту, підтверджує емпіричний закон Гейгера-Неттола
, (8.21)
де А і В константи, стала розпаду, R пробіг -часинки, який, очевидно, пропорційний до її енергії E. Цей закон показує, що менш стабільні ядра дійсно випромінюють -частинки з більшою енергією.
8.3.3. Існує три типи -розпаду: -розпад (ядро випромінює електрон ), +-розпад (ядро випромінює позитрон) і так зване електронне захоплення (ядро поглинає один з електронів К, рідше L, чи М шару свого атома). розпад відбувається за схемою
, (8.22)
з якої випливає, що при -розпаді масове число дочірнього ядра не змінюється, а зарядове число змінюється на одиницю; наприклад, . Як і при -розпаді, енергія реакції -розпаду визначається за дефектом мас реакції і лежить в межах від десятків кеВ до десятків МеВ.
Пояснення -розпаду зустрілось з труднощами:
незрозумілим було походження електрона (електронів у ядрах немає);
Ці труднощі усунули В. Паулі та Е. Фермі (19301934 рр.). Вони висунули гіпотезу, що електрон при -розпаді виникає в ядрі разом з антинейтрино за рахунок процесу перетворення нейтрона в протон:
. (8.23)
Антинейтрино, практично, не має маси і електричного заряду, його спін . Процес (8.23) можливий енергетично, бо ; він пояснює походження електрона при -розпаді, а також незмінність масового числа і зростання зарядового числа дочірнього ядра на одиницю (протон залишається в ядрі). Виліт з ядра двох партнерів (електрона і антинейтрино), спіни яких компенсуються, усуває трудність зі спіном при -розпаді, а також пояснює неперервний характер -спектру, бо максимальна енергія -розпаду Emax розподіляється між двома партнерами випадково. Походження -променів, що супроводжують -розпад таке ж, як і при -розпаді: дочірнє ядро може виникати у збуджених станах, випромінюючи -кванти при переходах у більш низькі стани.
+-розпад відбувається за схемою
, (8.24)
наприклад, . Він супроводжується випромінюванням позитрона і нейтрино , які є античастинками, відповідно, для електрона і антинейтрино . Цей вид -розпаду має місце для штучно-радіоактивних ядер, які мають надлишок протонів над нейтронами. Його можна пояснити за рахунок процесу перетворення протона в нейтрон:
. (8.25)
Для вільного протона цей процес неможливий, бо ; в ядрі ж протон може запозичити потрібну енергію від інших нуклонів ядра.
Реакція електронного захоплення має вигляд
, (8.26)
що можна пояснити перетворенням протона в нейтрон:
. (8.27)
Захоплення електрона ядром супроводжується характеристичним рентгенівським випромінюванням, яке зумовлене перебудовою електронної оболонки атома внаслідок виникнення електронної вакансії у ній. По цьому випромінюванню Л. Альверс і відкрив К-захоплення, у 1937 р. Прикладом цього процесу може бути перетворення калію в аргон:
Суттєва для пояснення -розпаду гіпотеза нейтрино Паулі-Фермі стала початком вивчення так званої слабкої взаємодії, відповідальної за ряд перетворень елементарних часток. Ця гіпотеза була підтверджена експериментально у 1956 році Ф. Райнісом і К. Коуеном. При роботі на реакторі, що давав потужний потік нейтронів (і антинейтрино), їм вдалося підтвердити реакцію
, (8.28)
яка, фактично, є оберненням реакції (8.23).
У цьому ж році Р. Девіс підтвердив також існування електронного нейтрино . Пізніше було виявлено й інші типи нейтрино і антинейтрино: мюонне () і таонне (); вони зявляються в процесах взаємодії з мюонами і лептонами. Доведено, що різні частинки, як і їх античастинки .
8.3.4. Важливим для практичних застосувань радіоактивності є поняття активності. Під активністю радіоактивного зразка розуміють число розпадів, які відбуваються в ньому за одиницю часу,
. (8.29)
З (8.13) випливає, що
, (8.30)
тобто активність змінюється з часом за законом
, (8.31)
де активність при . Одиницею активності в СІ є 1 бекерель [Бк], що відповідає одному розпадові за секунду. Позасистемними одиницями активності є 1 кюрі [Кі] та 1 резерфорд [Рд]; 1 Кі = 3,71010 Бк, 1 Рд = 106 Бк.
За відомою активністю може бути розрахована експозиційна, поглинута та еквівалентна доза радіації і потужність дози (доза, віднесена до часу опромінення).
Експозиційна доза Дексп є мірою іонізації повітря рентгенівським або -випромінюванням. Вона чисельно рівна відношенню сумарного заряду всіх іонів одного знаку Q, створених в елементарному обємі повітря вторинними частинками при їх повному гальмуванні, до маси m повітря в цьому обємі . Одиницею експозиційної дози є , позасистемною одиницею рентген [Р]; . 1 Р відповідає утворенню 2,08109 пар іонів в 1 см-3 повітря при нормальних умовах, на це потрібно затратити енергію .
Поглинута доза Дпогл визначається відношенням енергії E, переданої іонізуючим випромінюванням речовині в елементарному обємі, до маси речовини в цьому обємі . Одиницею поглинутої дози є грей [Гр]; . Позасистемною одиницею поглинутої дози є рад; .
Біологічна дія радіації суттєво залежить від природи проникаючого випромінювання. Для характеристики цього вводиться коефіцієнт якості випромінювання k .
Таблиця 1.
Випромінювання |
k |
Рентгенівські промені, -промені, -промені |
1 |
Теплові нейтрони |
3 |
Швидкі нейтрони і протони |
10 |
Іони високих енергій |
20 |
Еквівалентна доза Декв визначається як добуток поглинутої дози Дпогл на коефіцієнт якості випромінювання k, тобто Декв = kДпогл. Одиницею еквівалентної дози є зіверт [Зв], що відповідає поглинутій дозі в 1 Гр при k = 1. Позасистемною одиницею є бер, що відповідає поглинутій дозі в 1 рад при k = 1; .
Для вимірювання доз радіації в дозиметрії використовуються прилади різних типів дозиметри. Природні джерела радіації створюють на території України потужність еквівалентної дози 40 200 мБер/рік. Еквівалентна доза в 4 5 Зв, отримана людиною за короткий проміжок часу, може призвести до смерті. Така ж доза, отримана протягом усього життя людини, не викликає помітних змін.
§8.4. Ядерні реакції
8.4.1. Ядерні реакції перетворення ядер при їх взаємодії з легкими частинками або іншими ядрами. Така взаємодія виникає при зближенні реагуючих частинок до відстаней ~ 10-15 м. Найбільш поширеним типом ядерних реакцій є взаємодія легкої частинки a з ядром Х, в результаті якої виникають легка частинка b (або b, c, d, …)і ядро Y:
, (8.32)
що скорочено позначають Х(а,b)Y. Вживається також лаконічне позначення ядерних реакцій типу (а,b). В якості легких часток можуть фігурувати: нейтрон, протон, дейтрон, -частинка, -квант (інколи електрон, нейтрино, інші елементарні частинки). Наприклад, перша ядерна реакція, здійснена Е. Резерфордом (1919 р.), мала вигляд: . Ядерні реакції основний метод вивчення структури ядра і його властивостей.
Ядерні реакції часто можуть протікати кількома способами, наприклад: , , . Сукупність частинок, що зазнають зіткнень, називають вхідним каналом ядерної реакції. Частинки, що народжуються внаслідок ядерної реакції, утворюють вихідний канал ядерної реакції.
Кількісне описання ядерних реакцій з квантово-механічної точки зору може бути тільки статистичним, тому для характеристики ядерних реакцій та різних видів взаємодій в них вводяться поняття виходу ядерної реакції w та ефективного перерізу взаємодії .
Вихід ядерної реакції w доля часток, що зазнали взаємодії. Якщо з потоку часток N, що падають на деяку мішень, зазнають взаємодії N часток, то ймовірність взаємодії . З другого боку, очевидно, , де S площа поверхні мішені, а ефективна площа взаємодії; ефективна площа взаємодії одного ядра, d товщина мішені, n концентрація ядер мішені. Тому і
(8.33)
Величина характеризує ймовірність взаємодії в розрахунку на одне ядро в шарі одиничної товщини. Вона має розмірність площі, її прийнято вимірювати в барнах; 1б = 10-28 м2.
Ядерні реакції можна класифікувати: за енергією часток, що їх викликають, за природою часток, за масовим числом ядер, які беруть участь у реакціях; за енергетичним ефектом; за характером ядерних перетворень. Зокрема, розрізняють ядерні реакції:
У будь-якій ядерній реакції виконуються закони збереження електричного заряду, енергії, імпульсу, момента імпульсу та деякі інші, більш екзотичні, про які йтиме мова у наступному параграфі. Вони відіграють особливо важливу роль, оскільки дозволяють передбачати які з ядерних реакцій можливі.
Енергію реакції можна розрахувати на основі формули (8.7), де m дефект маси реакції, який визначається співвідношенням
. (8.34)
Якщо енергія виділяється; якщо енергія поглинається. При цьому для ендотермічних реакцій характерним є енергетичний поріг мінімальне значення енергії часток, що стикаються, при якому реакція може відбуватися.
Стосовно механізму ядерних реакцій при низьких енергіях Н. Бор припустив, що вони здійснюються у два етапи. На першому етапі ядро Х захоплює частинку а; в результаті цього виникає проміжне компаунд-ядро П (складене ядро). За рахунок енергії частинки а (кінетичної та енергії звязку), яка перерозподіляється між нуклонами ядра, проміжне ядро стає збудженим. На другому етапі збуджене компаунд-ядро П випромінює частинку b і перетворюється в ядро Y; в цілому процес має вигляд
. (8.35)
Середній час життя компаунд-ядра складає (10-16 10-12) с, він значно більший від часу проходження нуклоном ядра c, тому захоплення частинки а і випромінення частинки b незалежні процеси.
Якщо , процес (8.35) називають розсіюванням; власне ядерна реакція має місце, якщо a не тотожне з b. При енергії збудження компаунд-ядра П, меншій необхідної для відокремлення від нього часток, єдиний шлях його перетворення випромінювання -квантів; такий процес називають радіаційним захопленням.
При великих енергіях бомбардуючих часток проміжне ядро не утворюється, процес має вигляд (8.32) і носить назву прямої ядерної взаємодії. Ілюстрацією таких процесів є так звана реакція зриву, коли ядро зриває один з нуклонів з пролітаючого повз нього дейтрона, або зворотна їй реакція підхоплення, коли пролітаючий повз ядро нуклон підхоплює відповідний нуклон ядра з утворенням дейтрона.
Найчисленнішими є реакції, які викликаються нейтронами. Завдяки відсутності електричного заряду нейтрону не доводиться долати потенціальний барєр ядра, тому в ядра легко проникають навіть теплові нейтрони з енергією Е ~ 0,03 еВ. Як правило, для захоплення нейтронів має місце монотонна залежність , однак спостерігаються випадки резонансного захоплення нейтронів. Так, для різко зростає при Е = 7 еВ, досягаючи 23000 барн. Таке резонансне поглинання має місце, коли енергія, внесена нейтроном у компаунд-ядро, рівна тій, яка необхідна для його переводу на збуджений енергетичний рівень.
Цікавою є реакція , яка постійно відбувається в атмосфері Землі під дією нейтронів космічних променів. Вона приводить до виникнення радіовуглецю з періодом піврозпаду 5730 р. Він служить «годинником» для антропологів, подібно, як уран для геологів.
8.4.2. Важливу групу ядерних реакцій складають реакції поділу важких ядер при їх бомбардуванні нейтронами (О. Ган, Р. Штрасман, О. Фріш, Л. Мейтнер, 1938 р.). При цьому ядро ділиться на декілька більш легких ядер (найчастіше на два уламки зі співвідношенням мас 2:3) з випроміненням 2-3 вторинних нейтронів і виділенням величезної енергії (порядку 1 МеВ на нуклон); наприклад,
. (7.36)
Мінімальна енергія, необхідна для поділу ядра, називається енергією активації; її вносить в ядро бомбардуючий нейтрон. Це приводить до деформації ядра внаслідок порушення рівноваги кулонівських сил і сил поверхневого натягу (в рамках краплинної моделі ядра), поділу ядра і розлітання уламків з великими швидкостями (Н. Бор, Я.І. Френкель, 1938р.). Уламки виносять понад 80% енергії поділу, ~10МеВ виносять нейтрони, решта енергії виділяється під час -перетворень продуктів поділу.
Оскільки відношення числа нейтронів до числа протонів для середніх ядер ~1,3, а для важких ядер ~1,6, звільнення уламків від надлишку нейтронів і приводить до виникнення вторинних нейтронів. Переважна більшість їх виникає в момент поділу (миттєві нейтрони); однак, ~0,7% вторинних нейтронів виникають з запізненням (запізнілі нейтрони). Вони “випаровуються” -радіоактивними уламками вже після поділу ядра з розкидом в часі від 0,05с до десятків секунд. Саме це дозволяє плавно керувати ланцюговою реакцією поділу.
Ядерна реакція стає ланцюговою, якщо частинки, що її викликають, виникають як продукти цієї реакції. В реакції типу (8.36), викликаній тепловим нейтроном, вторинні нейтрони є швидкими (з енергією E > 1 МеВ) в середній кількості = 2,5 на кожний акт поділу. Якщо частина f загальної кількості вторинних нейтронів буде використана для продовження реакції поділу, то на один нейтрон першого покоління прийдеться
(8.37)
нейтронів другого покоління, тому швидкість зміни потоку нейтронів і
, (8.38)
де n0 потік нейтронів при t = 0, час життя покоління нейтронів.
Якщо , здійснюється самопідтримувана ланцюгова реакція, що має місце в ядерних реакторах. При реакція перестає бути регульованою і закінчується вибухом; при ланцюгова реакція згасає.
Вивчення можливостей реалізації цих умов показало, що природний уран містить ~99,3% ізотопу і ~0,7% ізотопу . Ядра діляться як швидкими, так і тепловими нейтронами, ядра діляться лише швидкими нейтронами з енергією Е > 1 МеВ, але ефективний переріз поділу для них малий. Конкуруючими процесами є непружне розсіяння і радіаційне захоплення нейтронів, тому в природному урані ланцюгова реакція поділу самочинно розвинутись не може, вона згасає. Якщо природний уран достатньо збагачений ізотопом , то на швидких нейтронах реалізується співвідношення типу (8.37):
, (8.39)
де середнє число нейтронів на кожний захоплений нейтрон, коефіцієнт використання швидких нейтронів. З умови визначаються критичні розміри і критична маса атомної бомби, що для дає R ~ 9 см і mкр ~ 50 кг. При ядерні заряди можна зберігати; при зєднанні докритичних мас у надкритичні відбувається атомний вибух, еквівалентний вибуху 2104 тон тротилу (США, 1945; СРСР, 1949р).
При реалізації ланцюгової реакції поділу на теплових нейтронах необхідне використання сповільнювача нейтронів (важка вода , графіт, які мало поглинають нейтрони). Тоді стає можливим використання природного урану. Коефіцієнт розмноження теплових нейтронів у цьому випадку визначається співвідношенням:
. (8.40)
Це так звана формула чотирьох співмножників, де коефіцієнт зростання потоку нейтронів за рахунок поділу ядер швидкими нейтронами, доля сповільнюваних нейтронів, які не зазнають поглинання ядрами , коефіцієнт використання теплових нейтронів (не поглинутих домішками і не вилітаючих за межі активної зони). Якщо перші два співмножники залежать лише від активно подільчого матеріалу, другі два суттєво залежать від конструкції пристрою (реактора).
Оптимізація цих коефіцієнтів в уран-графітовому реакторі (реактор гетерогенного типу), де стрижні з природного урану відповідного діаметра складаються у своєрідну решітку з блоками графітового сповільнювача, дозволяє досягти і за допомогою автоматично регульованих стрижнів з Cd і B, які активно поглинають нейтрони, підтримувати регульовану ланцюгову реакцію поділу ядер на заданому рівні (США, 1942р; СРСР, 1946р). Використання відповідного теплоносія (вода, рідкі метали), який циркулює через активну зону, дозволяє відводити з неї тепло, що виділяється за рахунок утилізації кінетичної енергії уламків поділу, і перетворювати її в енергію пари (атомні двигуни) та електричну енергію (атомні електростанції). Запуск і плавне регулювання роботи атомного реактора можливі за рахунок використання запізнілих нейтронів; його зупинка досягається скиданням в реактор поглинаючих стрижнів з Cd і В, внаслідок чого k стає меншим одиниці.
Оскільки запаси урану на Землі обмежені, перспективним є використання так званих реакторів-бридерів (розмножувачів), які працюють на швидких нейтронах. Тут миттєві нейтрони реактора використовуються частково для підтримання ланцюгової реакції, а частково для відтворення ядерного пального. За рахунок радіаційного захоплення нейтронів ядрами виникає ізотоп , який після двох -розпадів перетворюється в :
Цей ізотоп, як і , являється активно подільчим матеріалом.
На цих засадах базується сучасна ядерна енергетика з усіма її використаннями у мирних і військових цілях та екологічними проблемами, які вона породила. Зокрема, дуже актуальною є проблема поховання радіоактивних відходів, що накопичуються.
8.4.3. Другою групою ядерних реакцій, які супроводжуються виділенням величезної енергії, є термоядерні реакції синтезу більш важких ядер (наприклад, ) з більш легких (наприклад, ізотопів водню ). Для їх реалізації необхідні високі температури , щоб за рахунок кінетичної енергії ядра могли подолати потенціальний барєр і зблизитись до відстані 10-15 м радіуса дії ядерних сил. В природних умовах такі реакції мають місце в надрах зірок, зумовлюючи їх величезне випромінювання.
Як показав Г.Бете (1938 р), перетворення водню в гелій на зірках здійснюється за допомогою двох циклів (водневого і вуглецевого), які в кінцевому результаті еквівалентні реакції
. (8.41)
При більш високих температурах реалізуються гелієвий і неоновий цикли, які надзвичайно важливі для розуміння нуклеогенезу процесу синтезу хімічних елементів. Завдяки величезним размірам зірок на них ідеально вирішується проблема утримування (гравітаційного) і термоізоляції плазми (речовина при T 108 K являє собою високоіонізовану плазму). На Землі для цього треба шукати інші підходи.
Термоядерна реакція синтезу на Землі поки-що здійснена лише як вибухова у водневій бомбі (СРСР, США, 1953 р.), де детонатором служить атомна бомба, внаслідок вибуху якої у рівнокомпонентній суміші дейтерію і тритію виникають температура Т ~ 108 К і тиск Р ~ 1012 атм, що приводить до “підпалювання” термоядерної реакції синтезу
. (8.42)
В цій реакції виділяється енергія ~ 17,6 МеВ, яка на одиницю маси реагуючої речовини в 4 рази більша, ніж в реакції поділу; тому енергія термоядерних бомб становить ~ 105 106 т тротилового еквіваленту.
Надзвичайно привабливими видаються перспективи керованого термоядерного синтезу (КТС) як з точки зору практичної невичерпності дешевого для КТС пального (дейтерію у водах океанів), так і з огляду на суттєво меншу екологічну загрозу реакторів КТС. Тому вивчення КТС розпочалося ще у 50-ті роки ХХ століття.
Створення реактора КТС передбачає:
При цьому повинен виконуватись так званий критерій Лоусона:
(8.43)
Керовано нагріти речовину до таких температур можна: потужним газовим розрядом, гігантським лазерним імпульсом або бомбардуванням інтенсивним пучком часток. Тому дослідження проблем КТС ведуться в напрямках створення квазістаціонарних реакторів з магнітним утримуванням плазми та імпульсних реакторів з інерційним утримуванням плазми. В обох підходах ще є принципові труднощі, повязані з нестійкістю плазмових конфігурацій та проблемою домішок у плазмі, що ведуть до надмірних енергетичних втрат. Але небезпідставним є і оптимізм, що реактор енергетики майбутнього буде побудований.
§8.5. Елементарні частинки та фундаментальні взаємодії
Елементарні частинки в точному розумінні первинні, далі неподільні частинки, з яких, за припущенням, складається вся матерія. В сучасній фізиці цей термін вживається менш точно для найменування великої групи субядерних часток, які, за винятком протонів, не являються атомами чи атомними ядрами. Крім протонів p, сюди входять: нейтрони n, електрони e, фотони , мюони , -мезони, важкі лептони , нейтрино , «дивні» частинки (К-мезони, гіперони Λ, , , ), -частинки, -частинки, “чарівні”, “красиві” частинки, проміжні векторні бозони (w, z), різноманітні резонанси всього ~ 400 часток, переважно нестабільних, кількість яких продовжує зростати. Фактично, більшість з них не є елементарними. Частинки, що претендують на роль первинних елементів матерії, прийнято називати істинно елементарними.
Відкриття складного, несподіваного світу елементарних часток надбання квантово-релятивістської фізики ХХ століття. Деякі з елементарних часток були відкриті в звязку з вивченням будови атома (е, ), ядра (р, n, e) і в космічних променях (е+, , , , Λ0), решта на прискорювачах заряджених часток, які з 50-х років ХХ-століття стали основним інструментом дослідження елементарних часток.
Всі елементарні частинки є обєктами винятково малих мас і розмірів, що зумовлює квантову специфіку їх поведінки. Найбільш важлива квантова властивість всіх елементарних часток їх здатність народжуватися і знищуватися (випромінюватися і поглинатися) при взаємодії з іншими частинками.
Різноманітні процеси з елементарними частинками помітно відрізняються за інтенсивністю їх протікання. У звязку з цим взаємодії елементарних часток ділять на декілька видів: сильну, електромагнітну, слабку, гравітаційну. Інтенсивність взаємодій прийнято характеризувати безрозмірними параметрами, повязаними з квадратами констант звязку відповідних взаємодій.
Сильна взаємодія зумовлює найміцніший звязок елементарних часток. Для неї параметр (g стала мезон-нуклонної взаємодії), характерний час S 10-23c, радіус дії rS 10-15м. Саме вона забезпечує звязок нуклонів у ядрі.
Електромагнітна взаємодія менш інтенсивна, вона характеризується параметрами: (е елементарний електричний заряд), е 10-20с, re . Саме ця взаємодія відповідальна за звязок електронів з ядрами в атомах і атомів у молекулах.
Слабка взаємодія, як і сильна, короткодіюча, її параметри: (f електронно-нейтринний заряд, що відповідає полю слабких взаємодій), w 10-10с, rw 10-18м. Вона відповідальна за повільні процеси -розпаду ядер та розпад квазістабільних елементарних часток.
Гравітаційна взаємодія універсальна, але в звязку з малими масами елементарних часток на характерних для них відстанях м вона помітної ролі не грає: , rg ; однак вона може стати суттєвою на відстанях ~1035м.
Слід відмітити, що відносна роль різних взаємодій змінюється з ростом енергії часток. Але різні властивості симетрії сприяють їх розділенню до досить значних енергій. Лише в границі самих великих енергій поділ взаємодій на види, мабуть, втрачає зміст.
В залежності від участі в тих чи інших видах взаємодій елементарні частинки розбиваються на класи: лептони (“слабкі” частинки), адрони (“сильні” частинки) з підкласами мезонів (“середніх” часток) та баріонів (“важких” часток); окрему групу елементарних часток складають частинки, що є носіями різних взаємодій.
Групу лептонів складають: електрон , мюон , таон , відповідні нейтрино (, , ) та їх античастинки. Спін усіх цих частинок J = 1/2, тобто вони є ферміонами (підкоряються статистиці Фермі-Дірака). Маса мюонів , маса таонів , відомості про масу нейтрино недостовірні. Лептони приймають участь у слабкій взаємодії (заряджені також і в електромагнітній), але не зазнають сильної взаємодії. Лептони можна вважати істинно елементарними частинками, бо на сучасному рівні знань ніякої внутрішньої структури в них не виявлено.
Підгрупу мезонів складають заряджені чи нейтральні адрони, спін яких цілочисельний або дорівнює нулю, тобто вони є бозонами (підкоряються статистиці Бозе-Ейнштейна). Сюди входять піони , каони , -мезон, деони ; mK 970 me, m 1074 me, mD 3658 me. Всі вони нестабільні, розпадаються за рахунок слабкої і електромагнітної взаємодії, приймають участь також у сильній взаємодії.
Підгрупа баріонів обєднує нуклони (р, n) і гіперони (Λ,, , ), маса яких (1,2 1,8) mp. Спін цих адронів напівцілий, тобто вони, як і лептони, є ферміонами. Баріони приймають участь у всіх видах взаємодій.
Відкриті на прискорювачах (починаючи з 60-х років) резонанси, список яких все збільшується, є сильновзаємодіючими короткоживучими частинками. Вони трапляються з цілим і напівцілим спіном, тому, відповідно, відносяться до мезонів або баріонів.
До групи переносників взаємодій відносяться: фотони , що є квантами електромагнітного поля, проміжні векторні бозони w, z0, які є переносниками слабкої взаємодії, глюони кванти поля сильної взаємодії кварків, гіпотетичні гравітони кванти гравітації. Спін перших трьох типів квантів J = 1 , спін гравітона J = 2 , тобто всі ці кванти є бозонами.
Кожна елементарна частинка, поряд зі специфікою притаманних їй взаємодій, описується сукупністю дискретних значень певних фізичних величин, що її характеризують, так званих квантових чисел. Загальними характеристиками всіх елементарних часток є маса m, час життя , спін J, електричний заряд Q.
В залежності від часу життя елементарні частинки діляться на стабільні, квазістабільні і нестабільні. Стабільними вважаються електрон ( > 1021 р), протон ( > 1031 р), фотон, нейтрино. До квазістабільних відносяться частинки, які розпадаються за рахунок електромагнітної і слабкої взаємодії. Нестабільними є резонанси, які розпадаються за рахунок сильної взаємодії з характерним часом життя 10-23 с.
Спін частинки J, що характеризує її власний момент імпульсу, може бути цілим або напівцілим кратним величини (, де h постійна Планка). В цих одиницях у відомих часток J набуває значень ; серед резонансів зустрічаються частинки і з більшим спіном.
Електричний заряд Q частинки є цілим кратним елементарного заряду е. У відомих елементарних частинок .
Було помічено, що квантові числа елементарних часток повязані з законами збереження, які відображають певні симетрії у природі. Наприклад, закони збереження енергії Е, імпульсу , момента імпульсу відображають властивості симетрії простору-часу (однорідності часу, однорідності та ізотропності простору). Відповідні закони збереження (а також закон збереження електричного заряду) є точними; вони виконуються у всіх видах взаємодій. Разом з цим, елементарні частинки характеризуються ще рядом квантових чисел, повязаних з так званими “внутрішніми” симетріями.
Це, перш за все, баріонний заряд B. Для всіх баріонів B = +1, для антибаріонів B = 1, для всіх останніх часток B = 0. Має місце закон збереження баріонного заряду, який забороняє перетворення важких часток у легкі (наприклад, протона у позитрон і фотон); вважається, що він може порушуватися.
По-друге, лептонний заряд L трьох різновидів (Le, L, L). Для всіх лептонів L = +1, для антилептонів L = 1, для решти часток L = 0. Має місце закон збереження лептонного заряду, який забороняє процеси зі зміною L (наприклад, ); вважається, що і він може порушуватися.
При розгляді адронів було помічено, що вони розбиваються на групи часток, близьких по масі з подібними властивостями, якщо “виключити” електромагнітну взаємодію (так звані зарядові мультиплети). Для характеристики цього було введене квантове число ізотопічного спіну І, яке пробігає цілі і напівцілі значення. Число часток у мультиплеті N = 2I + 1, вони відрізняються значенням проекції ізоспіну Із і величиною електричного заряду. Наприклад, для нуклонів І = 1/2, тому (протон, нейтрон). Має місце закон збереження ізоспіну, але він порушується електромагнітною і слабкою взаємодією.
Важливою характеристикою адронів є так звана внутрішня парність , яка описує поведінку хвильової функції системи часток при інверсії простору (тобто симетрію правого і лівого). Виявилось (1957 р.), що вона порушується слабкою взаємодією. Нею ж порушується і так звана зарядова парність яка описує симетрію часток та античасток і вводиться для абсолютно нейтральних часток.
Поняття античастинки ввів П. Дірак (1928 р.). Він встановив квантово-релятивістське рівняння для електрона, яке, при заданому імпульсі частинки р, дає власні значення енергії
, (8.44)
тобто дві області значень енергій, розділені забороненим проміжком шириною (рис.8.7).
Стани з відємною енергією не спостерігаються, оскільки вони заповнені електронами (вакуум системи). Збудження системи зводиться до переходу електрона з заповнених рівнів на вільні; внаслідок цього виникає вільний електрон і вакансія в системі заповнених рівнів “дірка”. Ця вакансія веде себе як електрон з додатніми масою і зарядом, вона одержала назву позитрон. Для виникнення пари електрон-позитрон потрібна мінімальна енергія .
Процес
(8.45)
описує акт народження пари фотоном; із-за необхідності виконання законів збереження енергії та імпульсу він повинен відбуватись в полі частинки Х. Можливий і зворотний процес анігіляції пари
. (8.46)
Він не вимагає присутності сторонньої частинки, оскільки народжуються два фотони.
Існування позитрона у 1932 р. було підтверджене експериментально (К.Андерсон виявив позитрони в космічних променях). У 19551956рр. були відкриті антипротон і антинейтрон . Античастинки існують і у бозонів: , наприклад, є античастинкою для . Існують і абсолютно нейтральні частинки (, 0,). Вони нездатні анігілювати, але можуть перетворюватися в інші частинки.
Оскільки час життя частинок і античастинок однаковий, можливе, в принципі, існування антиречовини (відкриті ядра антидейтерію, антигелію, антитритію, 1965-1974рр.). Проте, існування антиречовини у Всесвіті астрономами не виявлено.
Найбільша група елементарних часток адрони діляться на звичайні, “дивні”, “чарівні”, “красиві”, “істинні” частинки. Цьому поділу відповідає наявність у адронів екзотичних квантових чисел: дивності S, чарівності С, краси b, істинності t. Квантове число дивності S = 0, 1, 2, 3 було введене для пояснення парного народження і відносно великого часу життя Kмезонів і гіперонів, які виникають за рахунок сильної взаємодії, а розпадаються за рахунок слабкої взаємодії. Аналогічно були введені квантові числа C, b для пояснення особливостей народження і розпаду чарівних і красивих часток. Всі ці квантові числа є адитивними: вони зберігаються у сильній та електромагнітній взаємодіях, але не зберігаються у слабкій взаємодії.
Таким чином, кожне квантове число описує певний вид симетрії часток і взаємодій з відповідним законом збереження, який може бути точним чи наближеним. Вивчення цих симетрій привело до класифікації елементарних часток і спроб побудови єдиної теорії фундаментальних взаємодій.
Виділення ізотопічних мультиплетів було першим кроком на цьому шляху, бо проілюструвало плідність концепції симетрії в теорії елементарних часток. Математичний апарат, який використовується для опису симетрій, відомий як теорія груп.
Групою називається множина елементів, для яких визначена операція множення, тобто для елементів a і b існує c = ab; існує також одиничний елемент e такий, що ae = a, і обернений елемент (). Якщо ab = ba, група абелева; у випадку ab ba група неабелева. Елементами групи, зокрема, можуть бути унітарні матриці U(n). Тоді говорять про унітарну унімодулярну групу SU(n). Можна уявити, що матриці групи SU(n) діють на nкомпонентні величини в деякому nмірному просторі (спінори групи). Величини, що перетворюються як добуток спінорів, називаються тензорами. Якщо при дії елементів групи на тензор його перетворені компоненти лінійно виражаються через компоненти вихідного тензора, про нього кажуть як про незвідне представлення групи. У фізичних застосуваннях компоненти незвідних представлень співставляються з певними частинками.
З точки зору теорії груп обєднання адронів в ізотопічні мультиплети виражає наявність у них симетрії, повязаної з групою SU(2), яка діє в ізотопічному просторі. Ізотопічні мультиплети є незвідними представлення групи SU(2), розмірність яких . Ізотопічні мультиплети розмірності 1, 2, 3, 4 реалізуються на адронах відповідно до значень ізоспіну .
На початку 60-х років виявилося, що звичайні і дивні адрони утворюють більш широкі обєднання, ніж ізотопічні мультиплети. Такі обєднання дістали назву унітарні мультиплети; їх виникнення повязане з існуванням у адронів більш широкої групи симетрії, а саме SU(3). Незвідні представлення цієї групи мають розмірність 1, 3, 6, 8, 10, 15… На адронах реалізуються представлення 1, 8, 10. Фундаментальне представлення розмірності 3 чомусь не реалізується.
У 1964 році М.Гел-Ман і Дж.Цвейг висунули гіпотезу: частинки, що відповідають фундаментальному представленню розмірності 3, не є адронами; вони являють собою нову різновидність сильновзаємодіючих часток зі спіном , з яких побудовані всі адрони. Ці частинки трьох типів (ароматів) були названі кварками: u (верхній), d (нижній), s (дивний).
Спостережувана розмірність унітарних мультиплетів адронів 1, 8, 10 була відтворена в припущенні, що мезони складаються із кварка q і антикварка , а баріони з трьох кварків. В подальшому, з врахуванням нових експериментальних фактів (відкриттям -лептона, чарівних і красивих адронів) і усвідомленням важливості лептон-кваркової симетрії, ця модель будови адронів була розширена шляхом включення до неї ще трьох ароматів кварків: чарівного c, красивого b, істинного t. З теорії випливають квантові числа кварків, наведені в таблиці 2.
Таблиця 2.
J |
B |
I |
S |
C |
b |
t |
Q |
|
u |
1/2 |
1/3 |
1/2 |
0 |
0 |
0 |
0 |
2/3 |
d |
1/2 |
1/3 |
1/2 |
0 |
0 |
0 |
0 |
1/3 |
s |
1/2 |
1/3 |
0 |
1 |
0 |
0 |
0 |
1/3 |
c |
1/2 |
1/3 |
0 |
0 |
1 |
0 |
0 |
2/3 |
b |
1/2 |
1/3 |
0 |
0 |
0 |
1 |
0 |
1/3 |
t |
1/2 |
1/3 |
0 |
0 |
0 |
0 |
1 |
2/3 |
Привертають увагу дробові значення баріонного та електричного заряду кварків, які не зустрічались у жодної зі спостережуваних часток.
Вся багатоманітність адронів виникає за рахунок різних комбінацій кварків. Зокрема, звичайні адрони побудовані лише із u і d кварків; наприклад: , , , , являє собою лінійну суперпозицію станів і . Якщо в склад адрона входять s, c, bкварки, він буде дивним (S 0), чарівним (С 0), красивим (b 0): омега-мінус-гіперон з дивністю S = 3, деон з чарівністю C = 1, беон , краса якого b = 1. Існують і частинки з прихованою чарівністю та красою: , ; у них різниця між числом відповідних кварків і антикварків рівна 0.
Оскільки квантові числа елементарних часток Q, B, L, S, C, b, t адитивні (для античастинок вони мають протилежний знак), баріонний і електричний заряд адронів визначається сумуванням відповідних зарядів кварків (антикварків), що входять до складу адрона. Це дає B = 1 для баріонів і B = 0 для мезонів. Електричний заряд адронів визначається за формулою Гел-Мана-Нішіджіми
(8.47)
де так званий гіперзаряд адрона.
В основному стані спін мезонів може бути 0 або 1, а баріонів чи відповідно до спінових конфігурацій кварків: , ;, . В цьому відношенні гіпотеза кварків спочатку зустрілась з трудністю: хвильова функція адронів, побудованих з однакових кварків (наприклад ) була симетричною, хоча повинна бути антисиметричною, оскільки кварки ферміони. Ця трудність була подолана припущенням (М. Боголюбов, Й. Намбу, 1965 р.), що кварки, крім аромату, мають ще внутрішню характеристику “колір”, яка є аналогом електричного заряду. Тоді симетрична по просторових, спінових і унітарних змінних хвильова функція може бути антисиметричною по кольорових змінних. Виявилося необхідним для кожного аромату кварка ввести три основні кольори: червоний R, зелений G, синій B; для антикварків відповідні антикольори . Введення кольору потроює число різних кварків.
Вибір терміну “колір” зумовлений тим, що з його допомогою можуть бути стисло сформульовані правила побудови адронів: дозволені лише “білі” (безбарвні) комбінації кварків. Цього можна досягти або змішуванням трьох основних кольорів, або комбінуванням основного кольору з відповідним антикольором. Перша можливість реалізується в баріонах, друга в мезонах. При цьому хвильові функції адронів виявляються інваріантними відносно перетворень групи SUc(3), що діє в кольоровому просторі. Така симетрія називається калібрувальною інваріантністю (в даному випадку, відносно перетворень кольорів кварків).
Екзотичність властивостей кварків обумовила тривалі експериментальні пошуки їх існування у вільному стані, однак всі вони закінчились безрезультатно. В звязку з цим виникла гіпотеза конфайнменту (полонення) кварків в адронах.
На основі експериментально визначених мас звичайних, дивних, чарівних, красивих адронів можна оцінити ефективну масу кварків в адронах. Такі оцінки приводять до закономірності:
; (8.48)
тобто можна говорити про легкі і важкі кварки з масами 0,5 0,7 ГеВ у легких кварків і 1,5 22 ГеВ у важких.
Зявившись як гіпотетичні структурні елементи адронів, зручні для їх класифікації, в подальшому кварки набули статусу істинно елементарних часток, які завершують ланцюг структурних складових речовини. Ця думка стала переконанням після побудови теорії сильної і електрослабкої взаємодії елементарних часток.
Для опису взаємодії елементарних часток суттєвим є поняття поля як матеріального утворення, в кожній точці якого на частинку діє сила. Поля, що співставляються з елементарними частинками, мають квантову природу. Квантами електромагнітного поля є фотони; кванти інших полів відповідають усім іншим відомим елементарним частинкам. Розрізняють скалярні (однокомпонентні) поля, спінорні (двохкомпонентні) поля, векторні поля… Математично поле описується функцією, що задається в кожній точці простору-часу і має певні трансформаційні властивості відносно перетворень групи Лоренца і груп “внутрішніх” симетрій. Трансформаційні властивості відносно перетворень групи Лоренца задають спін часток (квантів поля): скаляру відповідає , спінору , вектору ; число компонентів поля . Трансформаційні властивості полів відносно перетворень “внутрішніх” просторів задають квантові числа L, B, I, S, C, b, t, а також “кольору”. Маса елементарних часток не звязана з трансформаційними властивостями полів, вона є додатковою характеристикою елементарних часток, але дуже суттєвою, бо визначає область взаємодії: коли дві частинки взаємодіють між собою віртуально, обмінюючись квантом поля, то масивні кванти обумовлюють скінченний радіус дії сил, а безмасові кванти дають нескінченний радіус дії.
Викладені уявлення про взаємодію елементарних часток виникли в квантовій електродинаміці (КЕД), створеній П. Діраком, Р. Фейманом, Дж. Швінгером, С. Томонагою протягом 1928-1948 рр. на основі обєднання ідей квантової механіки і спеціальної теорії відносності, що дозволило в прекрасному узгодженні з дослідом пояснити електромагнітну взаємодію. За своєю математичною структурою КЕД є локальною калібрувальною теорією з абелевою групою симетрії U(1). Це означає, що закони електромагнітної взаємодії інваріантні відносно перетворень, які виконуються незалежно в кожній точці простору і в кожний момент часу, причому ці перетворення переставні. Виявляється, що і теорія гравітації А. Ейнштейна (ЗТВ) є локальною калібрувальною теорією, але з неабелевою групою симетрії, бо перетворення в ній непереставні. Успіхи таких теорій уже давно надихали фізиків на пошуки шляхів обєднання фундаментальних сил природи, але пояснити слабку і сильну взаємодію тривалий час не вдавалося, бо, як стало зрозуміло недавно, не були знайдені відповідні локальні калібрувальні теорії.
Ситуація змінилася протягом 50-70-х років ХХ століття. Досліджуючи до яких наслідків призведе заміна глобальної SU(2) симетрії ізотопічного спіну локальною, Ч. Янг і Р. Мілс (1954 р.) показали, що інваріантність законів фізики при такій заміні зберігається ціною введення в теорію додаткових векторних безмасових полів (аналогічних до електромагнітного поля), які є носіями взаємодії; властивості і число цих полів визначаються властивостями групи “внутрішньої” симетрії. П. Хігс (1964 р.) показав, як за рахунок так званого спонтанного порушення симетрії калібрувальні поля можна зробити масивними. На основі цих ідей і арсеналу КЕД протягом 1966-1971 рр. була побудована теорія сильної взаємодії квантова хромодинаміка (КХД, Й. Намбу, Ш. Глешоу) і теорія електрослабкої взаємодії (С. Вайнберг, А. Салам, Ш. Глешоу).
В КХД взаємодія між кварками переноситься безмасовими векторними полями, властивості і число яких визначаються неабелевою калібрувальною групою SUc(3). Кванти цих кольорових полів отримали назву глюонів g; їх є , тобто при для групи SUc(3) 8 різних глюонів. Кожний глюон несе на собі ознаку кольору і антикольору; наприклад червоно-зелений глюон. Віртуальний обмін кварків глюонами за схемою
(8.49)
забезпечує локальну інваріантність сильної взаємодії відносно зміни кольору кварків.
Незважаючи на складність структури глюонного поля, КЕД і КХД дуже схожі за формою. Подібність між фотоном і глюоном у тому, що вони мають однаковий спін , нульовий електричний заряд, обоє безмасові, але по кольору глюони не є нейтральними. Це приводить до різної поляризації вакууму фотонними і глюонними полями. За рахунок електронно-позитронних пар заряд електрона в КЕД “екранується” (зменшується з відстанню), поле ж кольорових глюонів в КХД “антиекранує” кольоровий заряд кварка. В результаті сила взаємодії кварків на великих відстанях не змінюється з відстанню, тому неможливо “іонізувати” адрон (вільних кварків, як і глюонів, існувати не може). Модельно глюонне поле аналогічне полю плоского конденсатора; тобто, силові лінії глюонного поля мезона стягується в трубку; це дозволяє уявляти мезон як своєрідну струну з кварком і антикварком на кінцях (рис. 8.8).
На малих відстанях кварки практично не взаємодіють між собою (асимптотична воля), бо ефективна хромодинамічна константа взаємодії зменшується зі зростанням енергії. Спираючись на асимптотичну волю і гіпотезу конфайнменту кварків в КХД можна описувати процеси, в яких деталі утворення кінцевих станів з кварків і глюонів несуттєві; однак питання спектру мас адронів виходить за межі КХД.
Використання принципу визначальної ролі симетрії у формуванні структури взаємодії дозволило також побудувати теорію слабкої взаємодії. Одночасно був розкритий глибокий внутрішній зв'язок слабкої і електромагнітної взаємодій.
Існування пар лептонів: з однаковими лептонними зарядами, але з різними масами і електричними зарядами відображає наявність у лептонів симетрії типу ізотопічної з групою SUL(2). Збереження спіральності (напрямку проекції спіна частинки на напрям її руху) у слабких процесах можна звязати з існуванням у лептонів особливого гіперзаряду У і відповідної зарядової симетрії з групою UY(1). В цілому глобальна симетрія електрослабкої взаємодії описується групою SUL(2)UY(1). Вимога локальності цієї симетрії дає 4 янг-мілсовські безмасові калібрувальні бозони (3 від групи SUL(2) і 1 від групиUY(1)), причому 2 з них заряджені і 2 нейтральні. За рахунок механізму Хігса 3 з них одержують масу (проміжні векторні бозони ), а четвертий (фотон ) залишається безмасовим. Вони і є носіями електрослабкої взаємодії: обмін фотонами відповідальний за електромагнітну взаємодію, а проміжними векторними бозонами за слабку.
Інтригуючими передбаченнями цієї теорії було:
Експеримент блискуче підтвердив ці передбачення. Нейтральні слабкі процеси були виявлені у 1973 році, а у 1983 році на зустрічних протон-антипротонних пучках були отримані проміжні векторні бозони з масами 84 ГеВ у і 95 ГеВ у .
Локальна калібрувальна квантова теорія полів (КТП), яка сформульована на кварк-лептонному рівні і спирається на групу симетрії SUc(3)SUL(2)UY(1), одержала назву “стандартна модель”. Вона охоплює величезний інтервал енергій (102-1015 ГеВ), і стверджує, що основу фізичного світу складають 17 “елементів”(істинно елементарних часток):
6 лептонів (),
6 кварків (),
4 векторних бозони (фотон , глюон g, віони w, z),
1 гравітон;
(звичайно, потрібно також врахувати античастинки і кольори).
При цьому має місце лептон-кваркова симетрія, яка проявляється в можливості обєднання лептонів і кварків у покоління:
. (8.50)
Сучасний експеримент не дає нічого, що вимагало б виходу за межі “стандартної моделі”, теорія ж пропонує нові ідеї.
Перш за все, логічно спробувати обєднати сильну і електрослабку взаємодії в рамках локальної калібрувальної КТП. В цьому плані в 70-ті роки були запропоновані різні варіанти теорій так званого “великого обєднання” (ТВО). В цих теоріях за основу вибирається достатньо широка калібровувальна група (наприклад, SU(5)) і в таку модель “вкладаються” КХД і електрослабка теорія. Основою подібного обєднання служить кварк-лептонна симетрія і той факт, що константа сильної взаємодії зменшується зі збільшенням енергії, а електрослабкої зростає. При певній енергії вони можуть зрівнятись, орієнтовно це може відбутись при енергіях 1015 ГеВ. Локалізація SU(5)-симетрії веде до виникнення додаткових калібрувальних бозонів, відповідальних, зокрема, за перетворення кварків у лептони. Наслідком цього повинна бути нестабільність протона, але з часом життя 1032 років із-за великої маси відповідних бозонів. При енергіях <1015 ГеВ точна SU(5)-симетрія порушується (механізм цього незрозумілий), перетворюючись у “стандартну модель” з відповідними їй взаємодіями.
Слід відмітити, що в ТВО не вписується гравітація, оскільки спін гравітона . Включення гравітації у єдину теорію фундаментальних взаємодій вимагає побудови квантової теорії тяжіння. Певні надії повязуються тут з супергравітацією. Супергравітація теорія з локалізованою калібрувальною суперсиметрією. Перетворення суперсиметрії переміщують бозонні і ферміонні поля, обєднуючи в одні супермультиплети частинки однакової маси, але різного (цілого і напівцілого) спіну, включаючи гравітон. Енергетична межа суперсиметрії складає 1019 ГеВ, тому зараз немає її експериментального підтвердження.
З 80-х років увагу теоретиків привернули так звані суперструнні теорії як перспективні кандидати на обєднання усіх фундаментальних взаємодій, в тому числі і гравітації. Суперструни одновимірні релятивістські обєкти з довжиною 10-35м, які характеризуються і спіновими ступенями вільності. Числа ферміонних і бозонних ступенів вільності рівні, що і забезпечує суперсиметрію теорії. Частинки з найнижчою масою в теоріях суперструн включають гравітон зі спіном 2 і “калібрувальні” частинки зі спіном 1. Але є також безмежна кількість масивних часток, які відповідають вищим гармонікам коливної струни. Масовий масштаб визначається натягом струни T 1039т. Тому струна настільки коротка, що для більшості застосувань теорії струн не відрізняються від теорії точкових часток, а вищі моди струни настільки масивні, що не можуть бути виявлені безпосередньо. Однак на планківському рівні струнна природа фундаментальних часток суттєва для забезпечення несуперечливості квантової теорії.
Квантова теорія суперструн формулюється у 10-вимірному просторі-часі, але з незрозумілих поки-що причин відбувається компактифікація 6 вимірів до малих розмірів, які не спостерігаються на досліді. Привабливо, що теорія суперструн дозволить практично однозначно вибрати цю компактифікацію, а її топологічні властивості визначать основні риси низькоенергетичної динаміки суперструн, яка описує сучасну фізику елементарних часток, без необхідності підгонки параметрів теорії для узгодження з дослідом.
Таким чином, теорія суперструн органічно включає в себе суперсиметрію, ідею про багатовимірність простору-часу і нелокальність обєктів носіїв фундаментальних взаємодій. Суперструнні теорії спроба синтезу КТП і ЗТВ, мабуть, більш грандіозного, ніж синтез квантової механіки і спеціальної теорії відносності в КЕД, спроба побудови “теорії усього”. Ця теорія ще не має елегантного математичного формулювання, в ній не знайдений фізичний принцип типу принципу еквівалентності у ЗТВ. Якщо це буде зроблено, набудуть більш глибокого змісту такі основні поняття фізики як простір, час, поле.
PAGE 192