[Up]
http://www.math.hut.fi/teaching/p3/luentomateriaali/L2.html

Luennot 2-3

ti-ke 16-17.9.
KRE 7.5,7.6 (Joidenkin käsitteiden määrittely- ja esitysjärjestys hieman erilainen.)

Vektoriavaruus

Kannattaa palauttaa mieleen konkreettiset perusmallit: Avaruus R3 saadaan 3-d geometrisesta vektorimallista ottamalla kolme kiinteää vektoria (jotka eivät ole saman tason suuntaisia) koordinaattiakseleiksi (esim. suorakulmaiset perusvektorit) ja tarkastelemalla origosta alkavan paikkavektorin kärjen koordinaattien muodostamaa jonoa.

Tavalliset vektorilaskusäännöt : yhteen- ja vähennyslasku sekä skalaarilla (reaaliluvulla) kertominen ovat tällöin sitä, että


      u+v = (u1+v1,u2+v2,u3+v3)     cu = (cu1,cu2,cu3)
     

Avaruudet Rn ja Cn

Edellä sanottu yleistyy ottamalla vektoreiksi jonot v=(v1,v2,...,vn). Jos vektorin komponentit vi ovat reaalisia, on kyseessä reaalinen vektoriavaruus, tällöin skalaareina ovat reaaliluvut. Yhtä hyvin voimme tarkastella avaruutta Cn, jolloin vektorin komponentit ja skalaarikertoimet ovat kompleksilukuja. Laskutoimitukset määritellään siis vastaavasti kuin yllä.

Rajoitumme esimerkeissämme aluksi reaalisiin, mutta perusteoriassa ei ole (juuri) mitään eroa kompleksitapaukseen nähden.

Vektoriavaruuden perusominaisuudet (aksiomat)

Avaruuden Rn (yhtä hyvin Cn) vektoreilla (a,b,...) (ja skalaareilla c,d,...) on seuraavat ominaisuudet:

  (v1) a+b = b+a          (vaihdantalaki)
  (v2) (a+b)+c = a+(b+c)  (liitäntälaki)
  (v3) a+0 = a            (nollavektori)
  (v4) a+(-a)=0           (vastavektori)   ( -a tarkoittaa -1a )
  (v5) c(a+b)=ca+cb       (1. osittelulaki)
  (v6) (c+d)a=ca+da       (2. osittelulaki)
  (v7) c(da)=(cd)a        (skalaarilla kertomisen liitännäisyys)
  (v8) 1a=a               (skalaarilla kertomisen ykkösalkio)

Nämä ominaisuudet ovat välittömiä seurauksia reaali (kompleksi) lukujen vastaavista ominaisuukista.

Hienous piilee siinä, että ottamalla nämä ominaisuudet aksiomiksi, voidaan johtaa koko vektoriavaruuksien perusteoria, jolloin saadaan saman käsittelyn alle monia muitakin olioita kuin äärelliset lukujonot. Palataan tähän näkökulmaan myöhemmin. (KRE 7.15 s. 414)

Painoasuhuom: Tästä lähtien emme jaksa "lihavoittaa" vektoreita, emmekä juurikaan harrasta ala-ja yläindeksejä, kirjoitamme usein ai :n sijasta a[i]

Vektorialiavaruus

Tekisi mielemme sanoa, että vektoriavaruus on mikä tahansa joukko, jossa on vektoreiksi kutsuttavia olioita, joille pätevät ominaisuudet (v1)- (v8). Emme kuitenkaan vielä korosta tätä näkökulmaa, vaan tyydymme sanomaan, että vektoriavaruuksia ovat Rn, Cn ja niiden "aliavaruudet".

Aliavaruudella tarkoitamme Rn:n (tai Cn:n) osajoukkoa V, joka on "suljettu" laskutoimitusten suhteen, ts.

     a in V ja b in V        ==> a+b in V
     a in V , c in R (tai C) ==> ca in V 
(Pahoittelemme notaatiota, mutta HTML-kieli on rajoitettua, käytämme sanaa "in" joukkoon kuulumismerkkinä.)

Aliavaruudessa pätevät kaikki ominaisuudet ((v1) - (v8)) tietysti.

Geometrinen havainnollistus Muistathan aina tuon tuostakin miettiä, mitä jokin käsite tarkoittaa havainnollisessa geometrisessa maailmassamme. Ajatusviiva ---------

2-d-tasossa aliavaruuksia ovat O:n kautta kulkevat suorat (ja koko avaruus) (ja triviaalilla tavalla pelkkä O).
3-d-avaruudessa aliavaruuksia ovat koko avaruuden ja pelkän O:n lisäksi


Viritelmä.

Olkoot a[1],...a[m] in Rn .
Kaikkien lineaarikombinaatioiden joukkoa merk.

sp({a[1],...,a[m]}) . Se koostuu muotoa

                                  m
                                -----
                                 \
                                  )   c[i] a[i]
                                 /
                                -----
                                i = 1

olevista summista, missä c[i]:t ovat mielivaltaisia skalaareja. Joukkoa sp({a[1],...,a[m]}) kutsutaan vektorien a[1],...,a[m] viritelmäksi ( "span") .

Viritelmä on Rn:n aliavaruus, koska

Sanonta: Vektorit a[1],...,a[m] virittävät (ali)avaruuden V, jos V=sp({a[1],...,a[m]}).

Lineaarinen riippuvuus/mattomuus

(KRE 7.5)

Kyseessä ovat hyvin kauaskantoiset käsitteet. Tässä yhteydessä käytämme niitä erityisesti lineaaristen yhtälösysteemien ratkaisujen olemassaolo- ja yksikäsitteisyyslauseiden muotoiluun ja siinä tarvittaviin käsitteisiin.

Tarkastellaan vektoriyhtälöä

      c1a1 + c2a2 + ... + cmam = 0 
Tämä toteutuu, jos c1=c2= ... = cm=0 . (Triviaali ratkaisu)

Kaksi mahdollisuutta:

Havainnollisesti ...

Lause. Vektorit a[1],a[2],...,a[m] ovat LRV,
jos ja vain jos
Jokin a[k] on muiden lineaarikombinaatio.

Tod. (1) Oletetaan LRV. Tällöin on olemassa kertoimet c[1], ..., c[m], joista jokin # 0, s.e. yhtälö

      c1a1 + c2a2 + ... + cmam = 0 
toteutuu. Jaetaan tällä kertoimella (kun kerran on lupa) ja siirretään muut termit toiselle puolelle.

(2) Käänteinen puoli vastaavasti.

[QED]


Havainto 1. Jos 0-vektori on mukana vektorijoukossa, se on LRV.
Tietysti, koska voidaan valita 0-vektorin kertoimeksi mikä vain, vaikka 1 ja muiden vektorien kertoimiksi 0, näin saadaan ei-triv. lineaarikombinaatio, joka tuottaa 0-vektorin.

Havainto 2. LRT-joukon osajoukko on LRT, LRV-joukon ylijoukko on LRV.
Riittää selvittää vaikkapa jälkimmäinen: Olkoon {a[1],...,a[m]} LRV . Tällöin on olemassa kertoimet c[1],...,c[m] siten, että

      c1a1 + c2a2 + ... + cmam = 0 
ja jokin c[i]#0 . Jos joukkoon otetaan uusia jäseniä, niin laitetaan ne summaan jatkoksi 0-kertoimilla varustettuna. Näin saadaan edelleenkin ei-triv-lin. kombinaatio (äskeinen c[i] on mukana), joka antaa 0-vektorin.

Edellinen seuraa "kontrapositiolla", eli jos LRT joukolla olisi LRV osajoukko, niin tällä LRV-joukolla olisikin LRT ylijoukko, mikä on ristiriidassa edellä osoitetun kanssa.

Miten selvitetään LRT / LRV

Esim. Ovatko vektorit
a[1] := [3, 0, 2, 2], a[2] := [-6, 42, 24, 54],a[3] := [21, -21, 0, 15]

LRT / LRV ?
Kyse on siis siitä, onko vektoriyhtälöllä
      c1a1 + c2a2 + c3a3 = 0 
pelkästään triviaaliratk., vai onko muitakin.

No ei muuta kuin kirjoitetaan vektoriyhtälömme komponenttimuodossa (käytämme Maplea tekstinkäsittelyyn):

> c[1]*matrix(4,1,a[1])+c[2]*matrix(4,1,a[2])+c[3]*matrix(4,1,a[3]);
                            [3]        [-6]        [ 21]
                            [ ]        [  ]        [   ]
                            [0]        [42]        [-21]
                       c[1] [ ] + c[2] [  ] + c[3] [   ]
                            [2]        [24]        [  0]
                            [ ]        [  ]        [   ]
                            [2]        [54]        [ 15]
Yhdistämme komponentit:
> evalm(");
                         [3 c[1] - 6 c[2] + 21 c[3] ]
                         [                          ]
                         [    42 c[2] - 21 c[3]     ]
                         [                          ]
                         [     2 c[1] + 24 c[2]     ]
                         [                          ]
                         [2 c[1] + 54 c[2] + 15 c[3]]

Kysymys on siis yhtälösysteemin Ac = 0, missä
> A:=transpose(matrix([a[1],a[2],a[3]]));
                                  [3    -6     21]
                                  [              ]
                                  [0    42    -21]
                             A := [              ]
                                  [2    24      0]
                                  [              ]
                                  [2    54     15]
ratkaisuista.

Huomaamme siis, että tutkittavat vektorit ladottiin sarakkeiksi matriisiin A . Sitten on vain tehtävänä tutkia homogeeniyhtälön (siis yhtälön, jossa oikea puoli on 0-vektori) ratkaisujen lukumäärää.

    (1) Jos on pelkkä 0-ratkaisu (triv. ratk.), niin LRT.
    (2) Jos on muitakin, niin LRV
Homma johtaa siis Gaussin eliminaatioon:
> gausselim(A);
                               [3    -6     21]
                               [              ]
                               [0    42    -21]
                               [              ]
                               [0     0     30]
                               [              ]
                               [0     0      0]
Toiseksi alimmainen yhtälö: 30c[3] = 0 , joten c[3] = 0 . Siitä kun edetään ylöspäin, saadaan c[2] = 0 , c[1] = 0 .

Johtopäätös: LRT

Maple-huomautus. Jos haluat toistaa tämän Maplella, on aloitettava

> with(linalg):
> a[1]:=vector([3,0,2,2]):
> a[2]:=vector([-6,42,24,54]):
> a[3]:=vector([21,-21,0,15]):
 

Kanta(basis) ja dimensio

KRE 7.5 s. 354, GREE, 2.9 s. 50, STR 3.4 s. 140 (vanha painos)

Monia yhtäpitäviä tapoja määritellä. Otetaan lähemmin GREE:n esitystä mukaileva, itse asiassa tarkalleen STR:n mukainen.

Määritelmä. Vektoriavaruuden V kanta on vektorijoukko {e[1],e[2],...,e[m]}, joka

   1. on LRT
   2. virittää V:n
Havainnollisesti: 2 eri suuntaista vektoria tasossa on tason kanta, 3 vektoria, jotka eivät ole saman tason suuntaisia, muod. 3-d-avaruuden kannan.

Lause Jos {e[1],e[2],...,e[m]} on V:n kanta, niin jokaisella vektorilla v in V on yksikäsitteinen esitys muodossa
(Tämä on GREE-määritelmä.)

> sum(c[i]*e[i],i=1..m);  
                                  m
                                -----
                                 \
                                  )   c[i] e[i]
                                 /
                                -----
                                i = 1

Määritelmä. Vektoriavaruuden V dimensio on maksimimäärä LRT vektoreita, joka avaruuteen mahtuu. Tätä lukua merk dim V Jos äärellistä ylärajaa LRT-vektoreille ei ole, sanotaan, että avaruus on ääretönulotteinen.

Peruslause. Jos avaruudella V on kanta, jossa on m vektoria, niin dim V = m.

Tod. Olkoon {e[1],e[2],...,e[m]} avaruuden V kanta. Koska kanta on LRT, on
dim V >= m.

Jää siis näytettäväksi käänteinen puoli. Ts. osoitettava, että jokainen m+1 vektorin joukko on LRV.

Olk. {f[1],f[2],...,f[m+1]} mielivaltainen m+1 vekt. joukko. Koska {e[1],e[2],...,e[m]} on kanta, voidaan jokainen f[i]-vektori lausua kantavektoreiden e[k] lineaarikombinaationa:

> f[1]:=sum(a[1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                          f[1] :=   )   a[1, k] e[k]
                                   /
                                  -----
                                  k = 1

> f[m+1]:=sum(a[m+1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                      f[m + 1] :=   )   a[m + 1, k] e[k]
                                   /
                                  -----
                                  k = 1

Meidänhän piti tutkia f[k]-vektoreiden LRV:tä. Siksi muodostetaan yhtälö

      c[1]f[1] + c[2]f[2] + ... + c[m+1]f[m+1] = 0

Sijoitetaan tähän yhtälöön f[k]-vektorit lausuttuna e[k]-vektorien avulla. Kun kerätään kunkin e[k]:n kerroin yhteen ja käytetään hyväksi e[k]-vektorien LRT:tta, päädytään lineaariseen yhtälösysteemiin, jonka matriisi on
       [a[1, 1]     a[2, 1]     ...    a[m+1,1] ]
       [                                        ]
       [a[1, 2]     a[2, 2]     ...    a[m+1,2]]
       [                                        ]
       ....

       [                                        ]
       [a[1, m]     a[2, m]     ...    a[m+1,m]]

ja tuntemattomat ovat c[1], ..., c[m+1].
Siis r <= m < m+1 = n ja bmato=0 (HY). Tällöin n-r >=1 vapaata parametria, joten äärettömän monta ratkaisua ja siis LRV, kuten piti osoittaa.

(Yleisestihän pätee: Jos HY:ssä on enemmän tuntemattomia kuin yhtälöitä, niin ratkaisuja on ääretön määrä, eli ei-triviaaleja ratkaisuja on, juuri yllä mainitusta syystä, muistathan myös otsikon "Tärkeä seurauslause homogeenisille systeemeille" tällä sivulla (L1) [QED]


Olisi peräti merkillistä, ellei pätisi:

Lause. dim Rn=n

Tod. Vektorit e[1]=(1,0,...,0), e[2]=(0,1,0,...,), e[n]=(0,0,...,1) ovat LRT ja virittävät. Edellinen lause soveltuu siis.


Lause. dim(sp({u[1],...,u[m]})) = max määrä LRT vektoreita virittäjäjoukossa {u[1],...,u[m]}

Tod. Olkoon d mainittu max määrä. Numeroidaan vektorit niin, että {u[1],...,u[d]} ovat LRT, jolloin loput ovat lausuttavissa näiden lineaarikombinaatioina (muussa tapauksessa LRT vektoreita oliskin enemmän kuin d kpl.) Mutta kaikki sp({u[1],...,u[m]}):n vektorit voidaan lausua vektoreiden {u[1],...,u[d]} lineaarikombinaatioina (koska lineaarikombinaatioden lineaarikombinaatio on alkup. vekt. lin. komb.). Siten {u[1],...,u[d]} on sp({u[1],...,u[m]}):n LRT ja virittävä joukko, eli kanta.


Huom: Tämä voidaan yhtä hyvin ilmaista niin, että avaruuden sp({u[1],...,u[m]}) kanta saadaan valitsemalla maksimaalinen LRT joukko virittäjävektoreita.

Avaruuden Rn n:n vektorin joukko: Kantaan riittää toinen: LRT tai VIR

Lause (lkm=dim => (VIR<=>LRT)). Jos dim V = m ja jos {u[1],...,u[m]} on LRT tai virittää, niin se on V:n kanta.
Tod
(1) Jos {u[1],...,u[m]} on LRT, niin sen on pakko virittää, sillä virittämättömyydestä seuraisi sellaisen vektorin löytyminen, joka yhdessä näiden kanssa muodstaisi LRT joukon, vastoin dimension maksimaalisuutta.

(2) Jos {u[1],...,u[m]} virittää, niin se ei voi olla LRV, sillä muutenhan saataisiin vähemmän vektoreita sisältävä kanta pudottamalla tuo tarpeeton lineaarikombinaatio pois.



This page created by < Heikki.Apiola@hut.fi>
Last update Tue Sep 16 17:13:40 EET DST 1997