Normat 51:1, 15–21 (2003) 15
r har fjerdegradsligningen konstruerbare
røtter?
Kent Holing
Statoil Forskningssenter
Arkitekt Ebbels veg 10
NO–7005 Trondheim
kho@statoil.com
Innledning
Hvor mange konstruerbare røtter har en fjerdegradsligning? Spørsmålet besvares
presist når ligningen har rasjonale koesienter, og ved bruk av enkle kriterier gitt
av ligningens ko e sienter.
Fremstillingen i artikkelen er selvstendig, men lesere med behov for bakgrunns-
sto om geometriske konstruksjoner kan utfylle sine kunnskaper ved å lese websi-
den http://mathworld.wolfram.com/GeometricConstruction.html. Artikke len
Čabrić [1] fra Normat gir også en kort introduksjon til temaet geometriske kon-
struksjoner, som kan være nyttig å lese i den forbindelse.
To former for konstruerbarhet diskuteres i artikkelen: 1) Klassisk konstruksjon
med bare bruk av passer og en umerket linjal som vi kjenner fra skolen og 2)
konstruksjon med bare bruk av en merket linjal. Klassisk konstruerbarhet er ele-
mentært og greit bes krevet i boka Bold [2], som i tillegg til det ovenfor, kan anbefa-
les som innføring i temaet geometriske konstruksjoner. Også klassikeren Courant
& Robbins [3] har en god diskusjon konstruerbarhet (kapittel 3). Endelig er
konstruksjonsmetodene 1) og 2) definert presist i boka Martin [4], som gir en
velskrevet og grundig gjennomgang av de forskjellige geometriske konstruksjons-
metoder utviklet gjennom tidene.
Hva som er konstruerbart avhenger (naturligvis) av konstruksjonsreglene som
gjelder. Det er velkjent at tredeling av vinkelen generelt ikke er mulig med klassisk
konstruksjon. Lemper vi spillereglene for lovlige konstruksjoner i forhold til
de klassiske reglene, vil flere problemer kunne løses geometrisk også tredeling av
vinkelen. Arkimedes’ metode for tredeling av vinkelen ved hjelp av innskyting av et
holing.tex,v 1.13
16 Kent Holing Normat 1/2003
linjestykke med en gitt lengde er velkjent, og kan gjennomføres ved bruk av passer
og en merket linjal. Tredeling kan utføres ved bruk av en merket linjal alene, fordi
konstruksjon av kubikkrøtter er mulig med dette konstruksjonsverktøyet. Tredeling
kan utføres med bare bruk av en merket linjal da slik konstruksjon av kubikkrøtter
er mulig. At en merket linjal alene er et kraftig konstruksjonsverktøy i forhold
til klassisk kons truksjon, skyldes nettopp at kubikkrotutdragning kan utføres.
Klassisk konstruksjon av reelle størrelser kjennetegnes ved bruk av et endelig
antall rasjonale operasjoner og (reelle) kvadratrotutdragninger (presiseres senere),
mens konstruksjon med bare bruk av en merket linjal kjennetegnes i tillegg som
nevnt ovenfor ved bruk av et endelig antall (reelle) kubikkrotutdragninger. En
kompleks størrelse er konstruerbar hvis og bare hvis både dens real- og imaginærdel
er konstruerbar.
Konstruerbare røtter til fjerdegradsligningen
En setning om antall klassisk konstruerbare røtter til en gitt fjerdegradsligning
med rasjonale koesienter formuleres nedenfor ved hjelp av ligningens resolvent.
(Begrepet resolvent defineres nedenfor.)
For å bevise setningen bruker vi en velkjent betingelse for klassisk konstruer-
barhet (se [2]–[4] eller http://mathworld.wolfram.com/ConstructibleNumber.
html). Beviset krever også noe elementær kje nns kap til tredjegrads- og fjerdegrads-
ligningen. Det en trenger finnes i appendikset i Holing [5], i eldre bøker om lig-
ningsteori som Dickson [6]
1
eller igj en , Internett.
2
Bruker vi bare en merket linjal vil røttene til polynomligninger av grad opp til og
med 4 være konstruerbare. (Vi antar at koesientene til ligningene er konstruerbare
eller kan tolkes s om lengden av gitte linjestykker.) Det er velkjent at dette ikke
gjelder for ligninger med grad større eller lik 5. Generelt kan ikke en gang slike
ligninger løses algebraisk. For femtegradsligningen er det jo dette Abel er allment
mest kjent for. (Se også Sluttord, side 20.)
Det er allerede kjent i skolematematikken at for første- og annengradsligninger
er spørsmålet om klassisk konstruerbare (reelle) røtter trivielt. Røttene til første-
og annengradsligninger kan alle alltid konstrueres ved bare bruk av passer og en
umerket linjal. Når det gjelder røttene til tredjegradsligningen er situasjonen en
annen. Røttene kan ikke alltid konstrueres. Følgende resultat er velkjent:
Lemma. Om en tredjegradsligning med rasjonale koesienter har kun irrasjonale
røtter, kan ingen av dem konstrueres på klassisk vis.
No e tilsvarende gjelder ikke for fjerdegradsligningen: Ligningen (x
2
2)
2
=0er
en fjerdegradsligning med heltallskoesienter, og dens røtter ±
2 kan konstrueres
klassisk vis.
Vi viser setningen som besvarer artikkelens tittelspørsmål. Setningen gir en
kompakt og elegant karakterisering av klassisk konstruerbarhet av røttene til fjerde-
gradsligningen. Vi har ikke klart å finne setningen i litteraturen, selv om resultatet
nok være kjent fra før. Uansett fortjener det å bli bedre kjent!
1
Selv om boka Dickson er en relativt gammel referanse (fra 1947), er førsteutgaven fra 1914
lett tilgjengelig Internett: http://encompass.library.cornell.edu/math/math_D.html.
2
http://mathworld.wolfram.com/CubicEquation.html og http://mathworld.wolfram.com/
QuarticEquation.html.
holing.tex,v 1.13
Normat 1/2003 Kent Holing 17
Setning. La Q(x)=0være en monisk
3
fjerdegradsligning med heltallskoesienter.
La videre n være lik antall klassisk konstruerbare røtter til ligningen, der antall
røtter telles med multiplisitet og inkluderer komplekse røtter.
La R(t)=0være resolventen til ligningen Q(x)=0. Da gjelder:
a) n =0hvis og bare hvis verken Q(x)=0eller R(t)=0har heltallsrøtter,
b) n =1hvis og bare hvis Q(x)=0har én og bare én heltallsrot,
c) n =2eller n =3kan aldri inntre og
d) n =4hvis og bare hvis R(t)=0har minst én heltallsrot.
Bevis: Vi starter med litt bakgrunnsteori for å gjøre b e viset selvstendig.
Resolventen til fjerdegradsligningen Q(x)=0er en hjelpeligning R(t)=0av
tredje grad som brukes i løsningen av ligningen Q(x)=0til å faktorisere fjerde-
gradspolynomet Q(x) i et produkt av to annengradspolynomer. Fjerdegradslignin-
gen kan altså løses ved å løse en tredjegradsligning og to annengradsligninger.
R(t)=0er den såkalte Lagrange-resolventen i Ferraris løsningsmetode for fjerde-
gradsligningen. For
Q(x)=x
4
+ ax
3
+ bx
2
+ cx + d =0
omskrives Q(x)=0ved hjelp av en rot t av R(t)=0som (x
2
+
1
2
ax +
1
2
t)
2
=
(px+q)
2
der p og q er gitt fra fjerdegradsligningens koesienter og t. Vi bestemmer
t ut fra at en slik faktorisering av Q(x) blir mulig. Dette krever at t være en
rot av R(t)=0, en tredjegradsligning. Det er ikke vanskelig å vise at
R(t)=t
3
bt
2
+(ac 4d)t a
2
d +4bd c
2
=0.
Velg en rot t
0
av R(t)=0. Da er altså røttene til Q(x)=0uttrykt ved
t
0
og kvadratrøtter. Siden t
0
er en rot av en tredjegradsligning, kan uttrykket for
t
0
inneholde kubikkrøtter ellers opptrer høyst kvadratrøtter. Det er bare i t
0
at
kubikkrøtter opptrer i uttrykkene for røttene til Q(x)=0. Vi kan velge t
0
reell da
en tredj egradsligning med reelle ko e sienter alltid har minst én reell rot.
Vi vil også bruke en velkjent sammenheng av Lagrange mellom røttene til fjerde-
gradsligningen Q(x)=0og resolventen R(t)=0: Med henholdsvis x
1
, x
2
, x
3
og
x
4
, og t
1
, t
2
og t
3
røttene til Q(x)=0og R(t)=0, er
t
1
= x
1
x
2
+ x
3
x
4
,t
2
= x
1
x
3
+ x
2
x
4
og t
3
= x
1
x
4
+ x
2
x
3
.
Bevis for d ): Anta at R(t)=0har minst én heltallsrot t
0
. Ligningen Q(x)=0har
i følge det ovenfor røtter som alle kan uttrykkes med bruk av bare kvadratrøtter
og t
0
. Da t
0
er heltallig ser vi at vi får med høyst kvadratrøtter å gjøre. Men da er,
som kjent, alle røttene til Q(x)=0konstrue rbare og n =4.
Omvendt, anta at n =4. Sammenhengen til Lagrange ovenfor viser at røttene til
resolventen alle er konstruerbare når n =4. Siden R(t)=0er en tredjegradsligning
med heltallskoesienter den ifølge lemmaet ha minst én rasjonal rot, men denne
roten være heltallig da R(t) er monisk.
3
Dvs. med ledende koesient 1.
holing.tex,v 1.13
18 Kent Holing Normat 1/2003
Bevis for b): Anta n =1. Da er den eneste konstruerbare roten r reell, siden
komplekse røtter opptrer i konj ugerte par.
Hvis r ikke er rasjonal, r ligge i en gjentatt (reell) kvadratisk utvidelse
Q = F
0
F
1
F
2
···F
k1
F
k
av Q. Her er k det minste positive heltall slik at
r F
k
= F
k1
[
q]
med
r = u + v
q for u, v, q F
k1
,q>0 og
q F
k
\ F
k1
.
(Dette er b e tingelsen for konstruerbarhet vi nevnte ovenfor.)
Hvis Q(r)=Q(u + v
q)=a + b
q Q(u v
q)=a b
q. (Vis det!)
er a og b slik at hvis Q(r)=0 b =0, og derfor da også a =0. Q(r)=0
gir at Q(u v
q)=0, som betyr at v =0og dermed r F
k1
. Men dette er i
motstrid til definisjonen av k. Vi har jo at r/ F
k1
. (Tilsvarende argument finnes
gjengitt for tredjegradsligningen side 10–15 i [2] e ller teorem 2.18 i [4].)
Men da ser vi at r være rasjonal og derfor heltallig. Q(x)=0kan ikke ha
andre heltallsrøtter enn r; ellers ville n>1, Q(x)=0 ha én og bare én
heltallsrot, nemlig roten r.
Omvendt, la Q(x)=0ha én og bare én heltallsrot r.DakanQ(x) skrives
som et produkt av den lineære faktoren x r og en monisk faktor av tredje grad,
som også har heltalls-koesienter (hvorfor?). Den siste faktoren gir opphav til
en tredjegradsligning som ikke har heltallsrøtter, og da heller ikke rasjonale røtter.
Denne tredjegradsligningen kan i følge lemmaet derfor ikke ha konstruerbare røtter,
r er den eneste konstruerbare roten til Q(x)=0, dvs. n =1.
Bevis for c): Hvis n =2eller n =3, kombinér to konstruerbare røtter til Q(x)=
0 i en annengradsfaktor p(x) av Q(x). Da vil Q(x)=p(x)q(x) der q(x) er en
annengradsfaktor med konstruerbare koesienter. Men da har q(x)=0 som
p(x)=0 to konstruerbare røtter, og vi ha n =4.
Bevis for a): Anta n =0. Q(x)=0kan da ikke ha noen heltallsrot da slike er
konstruerbare. I følge d) kan heller ikke R(t)=0ha heltallsrøtter.
Omvendt, anta at verken Q(x)=0eller R(t)=0har heltallsrøtter. Da er n
verken 1 eller 4 og da n heller aldri kan være 2 eller 3, n =0.
Setningen er dermed bevist.
Vi ser at problemet med å telle antall klassisk konstruerbare røtter til en mon isk
fjerdegradsligning med heltallskoesienter er overført til problemet med å telle
antall heltallsrøtter for ligningen og dens resolvent. Dette er i prinsippet enkelt
å avgjøre da fjerdegradsligningen og resolventen i vårt tilfelle begge er moniske
ligninger med heltallskoesienter: Heltallsrøttene hvis de finnes finnes blant
divisorene til konstantleddene til Q(x) og R(t). Setningen ovenfor kan gene raliseres
til tilfellet Q(x)=0med rasjonale koesienter. (Bytt ut heltallsrot/røtter med
rasjonal rot/røtter i a), b) og d). Fortsatt blir c) riktig.)
holing.tex,v 1.13
Normat 1/2003 Kent Holing 19
Eksempler
Vi gir eksempler bruk av setningen ovenfor.
Fjerdegradsligningene Q(x)=x
4
+8x + 12 = 0 og Q(x)=x
4
+2x
2
+ x +3=0
har ingen konstruerbare røtter, dvs. n =0. Verken ligningene eller de tilhørende
resolventene har heltallsrøtter.
Videre har fjerdegradsligningen Q(x)=x
4
5x
2
+3x 2=0én og bare én
konstruerbar rot, dvs. n =1. Ligningen har 2 som eneste heltallsrot.
Fjerdegradsligningene
1) Q(x)=x
4
+2x
2
1=0,
2) Q(x)=x
4
+2x
3
+ x
2
+2x +1=0,
3) Q(x)=x
4
+ x
3
+ x
2
+ x +1=0 og
4) Q(x)=x
4
4x
3
+5x
2
2x 2=0
har røtter som alle er konstruerbare, dvs. n =4. Resolventene til ligningene har
alle minst én heltallsrot.
Vi skal også se nedenfor at alle røtter til fjerdegradsligninger med rasjonale
koesienter og med multiple røtter er konstruerbare, dvs. n =4(oppgave 1).
At røttene til fjerdegradsligningene 1) 3) ovenfor alle er konstruerbare kan
lett sees uavhengig av setningen ovenfor. Ligning 1) har ingen odde termer og er
derfor en annengradsligning for x
2
, mens ligningene 2) og 3) er såkalte resiproke
fjerdegradsligninger (1/x er rot for alle røtter x forskjellig fra 0) dvs. ligningene
er annen gradsligninger for x +1/x (hvorfor?).
Ligning 3) er også ekvivalent med ligningen x
5
1=0(x =1), den såkalte sir-
keldelingsligningen for den regulære femkanten, som er klassisk konstruerbar. Merk
at resolventen til de resiproke fjerdegradsligningene 2) og 3) har begge heltallsro-
ten 2. (At resolventen til en resiprok fjerdegradsligning har roten 2 gjelder generelt.
Setningen gir da at resiproke ligninger har røtter som alle er konstruerbare.)
Oppgaver
Vi utfordrer leseren til å bruke det hun har lært av artikkelen til å løse oppgavene
nedenfor, men først gir vi litt nød vendig bakgrunnsteori.
Med diskriminanten til fjerdegradsligningen Q(x)=0og resolventen R(t)=0
mener vi henholdsvis u ttrykkene
(x
1
x
2
)
2
(x
1
x
3
)
2
(x
1
x
4
)
2
(x
2
x
3
)
2
(x
2
x
4
)
2
(x
3
x
4
)
2
og
(t
1
t
2
)
2
(t
1
t
3
)
2
(t
2
t
3
)
2
,
der vi som ovenfor betegner røttene til ligningene Q(x)=0med x
1
, x
2
, x
3
og
x
4
, og røttene til R(t)=0med t
1
, t
2
og t
3
.
Sammenhengen av Lagrange ovenfor gir at diskriminantene til Q(x)=0og
R(t)=0er like. (Formelen for diskriminanten til en tredjegradsligning t
3
+ At
2
+
Bt + C =0er 18ABC 4A
3
C + A
2
B
2
4B
3
27 C
2
.)
holing.tex,v 1.13
20 Kent Holing Normat 1/2003
En fjerdegradsligning Q(x)=0med heltallskoesienter (rasjonale koesienter)
sies å være irredusibel over Z (Q) hvis og bare hvis Q(x) ikke kan skrives som et
produkt av faktorer av lavere grad med heltallskoesienter (rasjonale koesienter).
Oppgave 1. La Q(x)=0være en fjerdegradsligning med rasjonale koesienter
og multiple røtter.
a) Vis uten bruk av diskriminanten til Q(x)=0 at røttene til ligningen
Q(x)=0alle kan konstrueres på klassisk vis.
4
b) Vis a) ved å bruke diskriminanten til Q(x)=0.
5
c) Hva kan sies om rasjonale røtter til ligningen Q(x)=0?
6
Oppgave 2. La Q(x)=0være en monisk fjerdegradsligning med heltallskoesi-
enter og med diskriminant som er kvadrattall.
a) Vis at resolventen til Q(x)=0enten har ingen eller tre heltallsrøtter. Gi
eksempler på begge tilfeller.
7
b) Vis at hvis Q(x)=0i tillegg er irredusibel over Z, og har minst én klassisk
konstruerbar rot, har resolventen til Q(x)=0tre forskjellige heltalls-
røtter.
Sluttord
Vi ønsker til slutt å påpeke at vår setning lett kan brukes til å bestemme Galois-
gruppen til visse fjerdegradsligninger. Vi henvender oss her til lesere som allerede
kjenner Galois-teorien, eller vil sette seg inn i denne vakre teorien.
Galois-gruppen til polynomer er som kjent sentral når det gjelder å bestemme
om slike ligninger er algebraisk løsbare («løsbare ved rotutdragninger»). Det er slik
det i dag vises at femtegradsligningen generelt ikke kan løses algebraisk. Begrepet
algebraisk løsbar gjøres presist i Galois-teorien. Hadlock [7] og Escofier [8]
gir begge en meget god innføring i Galois-teori, for de som trenger det, og da
motivert rundt problemstillinger om geometriske konstruksjoner. Internettlenken
http://mathworld.wolfram.com/topics/FieldTheory.html er også et bra sted
å starte for den som vil sette seg inn i Galois-teorien.
Anta at Q(x)=0er en monisk fjerdegradsligning med heltallskoesienter
8
som er irredusibel over Z. (Se n ed enf or hvis ligningen ikke er irredusibel.) La, som
ovenfor, n være lik antall klassisk konstruerbare røtter til Q(x)=0, og la D være
4
Vink: Q(x)=0kan ikke være irredusibel over Q da største felles divisor av Q(x) og Q
(x) er
en faktor av Q(x), som er et polynom med rasjonale koesienter og av minst første grad. Videre
har en tredjegradsligning med rasjonale koesienter og med dobbel rot bare rasjonale røtter.
5
Resolventen til Q(x)=0har diskriminant lik 0 og derfor en dobbel rot.
6
Svar: Bortsett fra tilfellet når Q(x) er et perfekt kvadrat er minst to av røttene til Q(x)=0
rasjonale.
7
Vis at alle moniske tredjegradsligninger med heltallskoesienter og diskriminant som er kvad-
rattall har enten ingen eller tre heltallsrøtter. Den første fjerdegradsligningen i eksemplene oven-
for, Q(x)=x
4
+8x + 12 = 0, har en kvadratisk diskriminant (lik 576
2
) uten å ha heltallsrøtter.
Alle moniske fjerdegradsligninger med heltallskoesienter og bare heltallsrøtter har trivielt en
kvadratisk diskriminant.
8
Betingelsen Q(x) her er ikke begrensende som en kanskje skulle tro: Enhver fjerde-
gradsligning med rasjonale koesienter kan transformeres til en monisk fjerdegradsligning med
heltallskoesienter uten at Galois-gruppen forandrer seg.
holing.tex,v 1.13
Normat 1/2003 Kent Holing 21
diskriminanten til ligningen. Da er n =0eller n =4, og D er heltallig. Vi har sett
hvordan n og D lett kan bestemmes ved hjelp av ligningens koesienter.
Det er kanskje overraskende at vi ett unntak nær kan bestemme
Galois-gruppen til Q(x)=0ved kjennskap kun til n og D.
Med standard gruppenotasjon gjelder følgende: For n =0er Galois-gruppen A
4
eller S
4
etter som D er et kvadrattall eller ikke. For n =4er gruppen V hvis D er
kvadrattall. Er n =4og D ikke kvadrattall, gir ikke n og D alene nok informasjon
til å bestemme Galois-gruppen til ligningen, men Galois-gruppen er da enten D
4
(symmetrigruppen til kvadratet) eller Z
4
.
Vi viser til kapittel 16 i [8] og artikkelen Kappe & Warren [9] for detaljer
der også unntakstilfellet ovenfor behandles. Selv i unntakstilfellet har vi høyst me d
kvadratrøtter å gjøre fordi resolventen R(t)=0til Q(x)=0da har én (og bare
én) heltallsrot.
9
Merk at det er bare for n =0at D beregnes for å bestemme Galois-gruppen
(dvs. når R(t)=0ikke har heltallsrøtter). For n =4er Galois-gruppen V hvis
R(t)=0har tre (forskjellige) h eltallsrøtter og enten D
4
eller Z
4
hvis R(t)=0har
én (og bare én) heltallsrot (oppgave 2).
Vi antok ovenfor at fjerdegradsligningen Q(x)=0var irredusibel over Z. Hvis
Q(x)=0er redusibel, kan det å b estem me Galois-gruppen til ligningen bli mer
komplisert enn i det irredusible tilfellet. At redusible tilfeller er mer komplisert enn
irredusible tilfeller er sp e sielt riktig for ligninger av grad større enn 4. Vi henviser
til spesiallitteraturen.
Litteratur
[1] Branislav Čabrić: The trisection problem. Normat 45, 79–81 (1997).
[2] Benjamin Bold: Famous Problems of Geometry and How to Solve Them. Dover,
New York 1982. (Opprinnelig Van Nostrand Reinhold, New York 1969.)
[3] R. Courant and H. Robbins: What is Mathematics? An elementary approach to
ideas and methods. Oxford University Press, New York 1941 (Mange senere utgaver
finnes.)
[4] George E. Martin: Geometric Constructions. Springer-Verl ag, New York 1998.
[5] Kent Holing: På gjengrodde stiger. Normat 45, 62–78 (1997). (Appendiks
s. 75–78.)
[6] L. E. Dickson: Elementary Theory of Equations. Wiley & Sons, New York 1947.
[7] Charles Robert Hadlock: Field Theory and Its Classical Problems. The Carus
Mathematical Monographs no. 19, The Mathematical Association of America 1978
[8] Jean-Pierre Escofier: Galois Theory. Springer-Verlag, New York 2001.
[9] Luise-Charlotte Kappe and Bet te Warren: An Elementary Test for the Galois
Group of a Quartic Polynomial. The American Mathematical Monthly 96, 133–137
(1989).
9
For å skille mellom Z
4
eller D
4
gjør vi som i [9]: La Q(x)=x
4
+ ax
3
+ bx
2
+ cx + d =0,
t
0
være den eneste heltallsrot av R(t)=0, og definer P (x)=(x
2
t
0
x + d)(x
2
+ ax + b t
0
).
Om røttene til Q(x)=0er x
1
, x
2
, x
3
og x
4
, er nullpunktene til den første faktoren av P (x)
lik x
1
x
2
og x
3
x
4
, mens nullpunktene til den andre faktoren er x
1
+ x
2
og x
3
+ x
4
. (Vi har valgt
røttene til Q(x)=0slik at t
0
= x
1
x
2
+ x
3
x
4
er heltallig.) Med E lik den minste kroppsutvidelsen
av Q som inneholder røttene til R(t)=0, er Z
4
Galois-gruppen til Q(x)=0hvis og bare hvis
P (x)=0har alle sine røtter i E ellers er D
4
Galois-gruppen til Q(x)=0. Siden R(t)=0kan
løses som en annengradsligning er E lett å bestemme.
holing.tex,v 1.13