Innehåll[-] Feedback

Kartesiska produkter [-]

Den kartesiska produkten $X\times Y$ av mängderna $X$ och $Y$ är mängden som består av alla ordnade par $[a,b]$ (eller $(a,b)$) där $a\in X$ och $b\in Y$, dvs. \begin{equation*} X\times Y=\set{[a,b] \mid a\in X, \, b\in Y}. \end{equation*} Det ordnade paret $[a,b]$ an definieras som mängden $\{\{a\},\{a,b\}\}$ men det finns också andra möjliga definitioner och det är ytterst ovanligt att man verkligen behöver använda sig av den här definitionen.

Exempel [+]
  • $\R\times \R= \R^2$ är planet och elementen i $\R^2$, dvs. punkterna i planet skrivs vanligen i formen $(x,y)$.

Relationer [-]

En relation är någotslags samband mellan två storheter men följande mängdteoretiska definition är mera exakt men det är kanske inte genast helt klart vad den riktigt innebär:
En relation från mängden $X$ till mängden $Y$ (eller en relation i mängden $X$ om $Y=X$) är en delmängd av den kartesiska produkten $X\times Y$.

En relation som en riktad graf [+]

Om mängden $X$ innehålller ändligt många element så kan man beskriva relationen $W\subseteq X\times X$ som en graf i vilken elementen i $X$ är grafens noder och det finns en båge från nod $x$ till nod $y$ om och endast om $[x,y]\in W$.
Till exempel på följande sätt:

Relationen är

Du kan lägga till eller ta ort bågar (dvs. element i relationen) genom att först klicka på bågens startnod och sedan på dess ändnod.

I en icke-riktad graf gör man inte skillnad på bågens start- och ändnod.

Exempel: Relationen $<$ [+]

En relation i en mängd med ändligt många element kan framställas som en riktad graf men om det finns oändligt många element i mängden är det vanligtvis inte ett fungerande alternativ.

Till exempel $W=\{ [x,y] \,:\, x,\, y \in \R,\,\, x < y\}$ är en relation i mängden $\R$ och därför, som alla relationer i $\R$, en delmängd av planet $\R^2$. Men när man talar om den här relationen "mindre än" så avser man vanligen (som i många andra fall) ett predikat $M(x,y)$, som är sant då $[x,y]\in W$, dvs. då $x< y$ (och då lönar det sig förstås att istället för $M(x,y)$ skriva $x< y$).

 

Olika slag av relationer i en mängd $X$ [-]

Relationen $W$ i mängden $X$ är
  • reflexiv ifall $[x,x]\in W$för alla $x\in X$.
  • symmetrisk ifall $[x,y]\in W \to [y,x]\in W$ för alla $x$ och $y\in X$.
  • transitiv ifall $[x,y]\in W \And [y,z]\in W \to [x,z]\in W$ för alla $x$, $y$ och $z\in X$.
  • antisymmetrisk ifall $[x,y]\in W \And x\neq y \to [y,x]\notin W$ (dvs. $[x,y]\in W\And [y,x]\in W\to x=y$) för alla $x$ och $y\in X$.
  • asymmetrisk ifall $[x,y]\in W \to [y,x]\notin W$ för alla $x$ och $y\in X$.
  • total ifall $[x,y]\in W \Or [y,x]\in W$ för alla $x$ och $y\in X$.
Dessutom säger vi att $W$ är en
  • ekvivalensrelation ifall $W$ är reflexiv, symmetrisk och transitiv,
    • partiell ordning ifall $W$ är reflexiv, antisymmetrisk och transitiv,
    • fullständig ordning (eller linjär ordning) ifall $W$ är en partiell ordning och total,
    • välordning ifall $W$ är en fullständig ordning och i varje icke-tom delmängd av $X$ finns ett minsta element.
Ofta skriver man $xWy$ i stället för $[x,y]\in W$, till exempel $x\prec y$ och inte $[x,y]\in \prec$.
Exempel: Partiell ordning [+]
Låt $X$ vara en (icke-tom) mängd och $\mathcal P(X)$ mängden av alla dess delmängder (den sk. potensmängden). I mängden $\mathcal P(X)$ har vi relationen $\subseteq$: $A\subseteq B$ om och endast om $A$ är en delmängd av $B$. Den här relationen är en partiell ordning eftersom den är
  • reflexiv: $A\subseteq A$,
  • antisymmetrisk: Om $A\subseteq B$ och $A\neq B$ så finns det ett element $x\in B$ så att $x\notin A$ och då gäller $B\not\subseteq A$,
  • transitiv: Om $A\subseteq B$ och $B\subseteq C$ så är varje element i $A$ ett element i $B$ och eftersom varje element i $B$ är ett element i $C$ så är också varje element i $A$ ett element i $C$ så att $A\subseteq C$.
Dessutom har den här partiella ordningen också den egenskapen att ifall $A$, $B\in \mathcal P(X)$ så finns det en minsta övre gräns för mängderna $A$ och $B$, dvs. en mängd $C$ sådan att $A\subseteq C$, $B\subseteq C$ ($C$ är en övre gräns) och ifall $A\subseteq D$ och $B\subseteq D$ så gäller $C\subseteq D$ (det finns ingen "mindre" övre gräns). Det är klart att $C=A\cup B$. på motsvarande sätt finns det en största övre gräns som (naturligtvis?) är $A\cap B$.

Ekvivalensklasser [+]

Ifall $X$ är en icke-tom mängd och $\sim$ är en ekvivalensrelation i mängden $X$, så delar den mängden $X$ i delmängder $Y_j\neq \emptyset$, $j\in J$ som kallas ekvivalensklasser så att

  • $\cup_{j\in J} Y_j=X$,
  • $Y_j\cap Y_k=\emptyset$ ifall $j\neq k$,
  • $a\sim b \leftrightarrow$ $a$ och $b$ hör till samma mängd $Y_j$.
Ofta användar man sig av en ekvivalensrelation så att två element som är ekvivalenta (dvs. paret bildat av dem hör till relationen $\sim$) är "desamma", så att man istället för mängden $X$ behandlar mängden $\set{Y_j\mid j\in J}$, vars element är ekvivalensklasser.

Exempel: Heltal som ekvivalensklasser [+]

I mängden $X=\set{[m,n]\mid m,n\in \N}$ kan vi (när vi först definierat addition för naturliga tal) definiera en ekvivalensrelation $\sim$ så att $[m_1,n_1]\sim [m_2,n_2]$ om och endast om $m_1+ n_2= m_2+ n_1$.

Vi kontrollerar att det verkligen är frågan om en ekvivalensrelation:

  • Reflexivitet: $[m,n]\sim [m,n]$ eftersom $m+n=m+n$ (relationen $=$ är reflexiv).
  • Symmetri: Ifall $[m_1,n_1]\sim [m_2,n_2]$ så är $m_1+ n_2= m_2+ n_1$ och då gäller också (eftersom $=$ är symmetrisk) $m_2+ n_1= m_1+ n_2$ så att $[m_2,n_2]\sim [m_1,n_1]$.
  • Transitivitet: Ifall $[m_1,n_1]\sim [m_2,n_2]$ ja $[m_2,n_2]\sim [m_3,n_3]$ så är $m_1+ n_2= m_2+ n_1$ och $m_2+ n_3= m_3+ n_2$. Genom att addera båda sidorna får vi \[ m_1+n_2+m_2+n_3= m_2+n_1+m_3+n_2, \] dvs. \[ m_1+n_3+(n_2+m_2)=m_3+n_1+(n_2+m_2), \] av vilket följer att \[ m_1+n_3=m_3+n_1, \] vilket betyder att $[m_1,n_1]\sim [m_3,n_3]$. (Här använde vi oss av räknereglerna $(a+b)+c=a+(b+c)$ och $a+b=b+a$ för naturliga tal och av regeln $a+c=b+c\to a=b$ och det som man bör observera är att inga negativa tal behövs för att härleda dessa regler.)

De här ekvivalensklasserna "är" heltalen eftersom $m_1-n_1= m_2-n_2$ precis då $m_1+n_2=m_2+n_1$ och varje heltal kan (på många olika sätt) skrivas som $m-n$ där $m$ och $n$ är naturliga tal.

  

Funktioner [-]

En funktion från mängden $X$ till mängden $Y$ är "en regel som till varje element i mängden $X$ ansluter exakt ett element i mängden $Y$". Med hjälp av relationsbegreppet kan detta uttryckas på följande sätt:
$f$ är en funktion från mängden $X$ till mängden $Y$ eller $f:X\to Y$ ifall $f$ är en relation från mängden $X$ till mängden $Y$, dvs. en delmängd av den kartesiska produkten $X\times Y$ så att

  • för varje $x\in X$ finns det ett $y\in Y$ så att $[x,y]\in f$.
  • ifall $[x,y_1]\in f$ och $[x,y_2]\in f$ så är $y_1=y_2$.

Vanligtvis skrivs en funktion så att $y=f(x)$ om och endast om $[x,y]\in f$ (fastän $xf$ eller något motsvarande kunde vara bättre om man läser från vänster till höger).

  • Om $f:X\to Y$ är en funktion så är $X$ dess definitionsmängd och $Y$ dess målmängd.
  • Om $f:X\to Y$ är en funktion och $A\subset X$ så är $f_{|A}:A \to Y$ funktionen $f$ begränsad till mängden $A$ eller som en relation $f_{|A}=\set{[x,y]\mid [x,y]\in f,\, x\in A}$.
  • $Y^X=\set{f \mid f:X\to Y}$ dvs. mängden som består av alla funktioner med definitionsmängden $X$ och målmängden $Y$.

Anonyma funktioner [+]

Det är (i de flesta fall) klart vad man avser med talet $2$ men när man talar om uttrycket $x+3$ så är det inte nödvändigtvis klart om man avser den funktion, som avbildar $x$ på $x+3$ eller värdet av den här funktionen i punkten $x$. Om man avser funktionen och inte värdet så kan man skriva
$x\mapsto x+3$
@(x)x+2
function(x){return x+3;}
lambda([x],x+3);
eller något annat motsvarande.

Injektion, surjektion och bijektion [-]

Funktionen $f:X\to Y$ är en
  • injektion ifall $f(x_1)=f(x_2) \to x_1=x_2$ för alla $x_1,\, x_2\in X$,
  • surjektion ifall för varje $y\in Y$ finns ett $x\in X$ så att, $f(x)=y$,
  • bijektion om $f$ är både en injektion och en surjektion.
Ekvivalenta definitioner är att $f:X\to Y$ är en injektion ifall $x_1\neq x_2\to f(x_1)\neq f(x_2)$ för alla $x_1$, $x_2\in X$ och $f$ är en surjektion ifall värdemängden $f(X)=\set{f(x)\mid x\in X}$ är den samma som målmängden $Y$, dvs. $f(X)=Y$.
Exempel: Injektion och/eller surjektion [+]
Välj ett exempel:
      

Listor, talföljder och kartesiska produkter som funktioner [+]

  • Listan $[a,b,c,d]$ är (eller kan beskrivas som) en funktion $f$, vars definitionsmängd är $\{1,2,3,4\}$ (eller $\{0,1,2,3\}$) så att $f(1)=a$, $f(2)=b$, $f(3)=c$ och $f(4)=d$.
  • Talföljden $(a_n)_{n=0}^\infty=(a_0,a_1,a_2,\ldots )$ är (eller kan tolkas som) en funktion $a$, vars definitionsmängd är $\N_0$ så att $a(n)=a_n$ för alla $n\in \N_0$.
  • Ifall $X_j$ är en mängd för varje $j\in J$ där $J$ är en (annan) mängd så är den kartesiska produkten $\prod_{j\in J} X_j$ mängden som består av alla funktioner $f:J\to \bigcup_{j\in J} X_j$ som är sådana att $f(j)\in X_j$ för alla $j\in J$.

Sammansatta och inversa funktioner [-]

  • Om $f:X\to Y$ och $g:Y\to Z$ är två funktioner så är $h=g\circ f:X\to Z$ funktionen $h(x)=g(f(x))$.
  • Om $f:X\to Y$, $g:Y\to Z$ och $h:Z\to W$ är funktioner så gäller $(h\circ g)\circ f= h\circ (g\circ f)$ så att den här funktionen också kan skrivas i formen $h\circ g\circ f$.
  • Om $f:X\to Y$ är en funktion och det finns en funktion $g:Y\to X$ så att $(g\circ f)(x)=x$ och $(f\circ g)(y)=y$ för alla $x\in X$ och $y\in Y$ så är $f$ inverterbar, $g$ är den inversa funktionen till $f$ (eller $f$:s invers) och vanligtvis skriver man $g=f^{-1}$.
  • Funktionen $f:X\to Y$ är inverterbar om och endast om den är en bijektion.
  • Om $f:X\to Y$ är inverterbar så gäller $(f^{-1})^{-1}=f$ dvs. den inversa funktionen är också inverterbar och dess invers är $f$.

Observera att $f^{-1}$ inte är samma funktion som $h(x)= f(x)^{-1}$ vilken förutsätter att varje element i $Y$ (eller åtminstone i värdemängden $f(X)$) har en invers vilket är tex. fallet i mängden $\R\setminus \{0\}$ men inte i mängden $\Z$.

Urbild mm. [+]

Antag att $f: X\to Y$ är en funktion (där $X$ och $Y$ är icke-tomma mängder). Urbilden av mängden $B\subseteq Y$ i avbildningen $f$ är \[ f^\leftarrow(B)= \set{x\in X\mid f(x)\in B}. \] Ofta används beteckningen $f^{-1}(B)$ men $f^{-1}$ är också den inversa funktionen.
$f^\leftarrow$ är alltså en funktion: $\mathcal P(Y)\to \mathcal P(X)$.

Ifall till exempel [+]

$X=Y=\R$ och $f(x)= \sqrt{\abs{x}}$ så är $f^{\leftarrow}(\{2\})=\{-4,4\}$, $f^\leftarrow({-1})= \emptyset$ och $f^\leftarrow([3,\infty[)=]-\infty,-9]\cup [9,\infty[$.

Ifall $A\subseteq X$ så avses med $f(A)$ vanligen mängden $\set{y\in Y\mid \exists x\in A\,(f(x)=y)}= \set{f(x)\mid x\in A}$. Men om tex. $X=\{a,\{a\}\}$, $Y=\{b,c\}$, $f(a)= b$ och $f(\{a\})=c$ så är det med den här definitionen inte klart om $f(\{a\})= c$ eller$\{b\}$. Därför skulle det vara förnuftigt att definiera funktionen $f^\to:\mathcal P(X)\to \mathcal P(Y)$ så att \[ f^\to(A)=\set{f(x)\mid x\in A}, \quad A\subseteq X. \]

Nu gäller till exempel att $f^\to$ är en surjektion då $f^\leftarrow$ är en injektion.

Varför? [+]

Vi visar först att om $f^\leftarrow$ är en injektion så är $f$ en surjektion och vi gör motantagandet att $f$ inte är en surjektion, dvs. det finns ett element $y_1\in Y$ så att det inte finns något $x\in X$ så att $f(x)=y_1$ dvs. $y_1\notin f^\to(X)$. I mängden $Y$ finns det ett element $y_2\neq y_1$ eftersom $X\neq \emptyset$ så att $f^\to(X)\neq \emptyset$. Men då är $f^\leftarrow(\{y_1,y_2\})=f^\leftarrow(\{y_2\})$ och eftersom $\{y_1,y_2\}\neq \{y_2\}$ så är $f^\leftarrow$ inte en injektion.

Nästa steg är att visa att om $f$ är en surjektion så ä också $f^\to$ en surjektion. Låt $B\in \mathcal P(Y)$ dvs. $B\subseteq Y$ vara en godtycklig mängd. Om nu $A=f^\leftarrow(B)$ så följer det av definitionen av funktionen $f^\leftarrow$ att $f^\to(A)\subseteq B$ och eftersom vi antar att $f$ är en surjektion så finns för varje $y\in B$ ett $x\in X$ så att $f(x)=y$ så att $x\in A=f^\leftarrow(B)$ och det betyder att $y\in f^\to(A)$. Av detta följer att $f^\to(A)=B$ och därför är $f^\to$ en surjektion.

Nu vet vi alltså att implikationerna ''$f^\leftarrow$ är en injektion'' $\to$ ''$f$ är en surjektion'' och ''$f$ är en surjektion'' $\to$ ''$f^\to$ är en surjektion'' är sanna och då är också implikationen ''$f^\leftarrow$ är en injektion'' $\to$ ''$f^\to$ är en surjektion'' sann.

Exempel: Fibonaccis tal som en rekursiv funktion [+]

Vi definierar funktionen $F$ på följande sätt: \begin{equation*} F(n)= \begin{cases} 1,& \text{$n=1$ eller $n=2$},\\ F(n-1)+F(n-2), &\text{$n>2$}. \end{cases} \end{equation*} Man kan visa att \begin{equation*} F(n)= \frac 1{\sqrt 5}\left (\left (\frac {1+\sqrt 5}2\right)^n-\left (\frac {1-\sqrt 5}2\right)^n\right ), \end{equation*} dvs. F=@(n)(((1+sqrt(5))/2)^n-((1-sqrt(5))/2)^n)/sqrt(5)

Ett annat alternativ är att räkna funktionens värde direkt ur definitionen tex. med följande rekursiva funktion
function f=F(n)
if n==1 || n==2, f=1;
else f=F(n-1)+F(n-2); end
return, endfunction

Om vi vill bestämma tex. talen $F(1), F(2),F(3),\ldots, F(15)$ kan vi först definiera F=[1,1]; och sedan räkna
for j=3:15, F(j)= F(j-1)+F(j-2); end
Men då blir tex. F(20) inte alls definierat.

Funktioner med flera variabler? [+]

Tillsvidare har endast behandlats funktioner med en variabel. På samma sätt kan man definiera funktioner med flera variabler (genom att först utvidga relationsbegreppet från det binära fallet) men det här är inte nödvändigt eftersom det finns andra sätt och nedan presenteras olika sätt att definiera och räkna ut värdena av en viss funktion med två variabler:
  • Som en funktion med två variabler: $f(x,y)=\sin(x+3\cdot y)$ och i matlab/octave tex. f=@(x,y)sin(x+3*y) så att funktionens värde i punkten $(1,2)$ är f(1,2).
  • Som en funktion med en vektorvariabel: $ f([x,y])= \sin(x+3\cdot y)$ och tex. f=@(X)sin(X(1)+3*X(2)) så att funktionens värde i punkten $(1,2)$ är f([1,2]).
  • Som en funktion av en (tex. den första) variabelns funktionsvärda funktion: $x\mapsto (y\mapsto \sin(x+3\cdot y))$ och tex. f=@(x)@(y)sin(x+3*y) så att funktionens värde i punkten $(1,2)$ är f(1)(2) (Fungerar inte i matlab!).

Ordo eller Stora-O: $f\in O(g)$ [-]

  • Ifall $h$ är en funktion som är definierad för alla "tillräckligt stora" tal så betyder $f\in O(h)$ att också $f$ är definierad för alla "tillräckligt stora" tal och det finns tal $C_f$ och $N_f$ så att \begin{equation*} \abs{f(n)}\leq C_f\abs{h(n)},\quad n\geq N_f. \end{equation*}
  • Användningen av den här beteckningen betyder alltså att det inte är speciellt relevant vad talen $C_f$ och $N_f$ riktigt är eller hur små de kan vara.
  • Ofta skriver man $f(n)= O(h(n))$ i stället för $f\in O(h)$ och då betyder beteckningen $O(h)$ någon funktion $f$, som har den egenskapen att $\abs{f(n)}\leq C\abs{h(n)}$ då $n\geq N$.
  • Om man skriver $O(n)+O(n^2)= O(n^2)$ och inte $O(n)+O(n^2)\subseteq O(n^2)$ så skall man minnas att man inte kan dra slutsatsen att $O(n)=0$!

Här behandlas för enkelhetens skull endast funktioner definierade för (vissa) heltal och endast hur de uppför sig då $n \to \infty$ men det är inte på något sätt väsentligt. Till exempel gäller också $\frac{x^4-x^3}{x^3+x^2}\in O(x)$ då $x\to 0$.

Exempel: [+]
  • Ifall $f\in O(n^2)$ och $g\in O(n^3)$ så gäller $f\cdot g\in O(n^5)$ eftersom $\abs{f(n)}\leq C_f n^2$ då $n\geq N_f$ och $\abs{g(n)}\leq C_g n^3$ då $n\geq N_g$ så att $\abs{f(n)\cdot g(n)} \leq C_f\cdot C_g\cdot n^{2+3}$ då $n\geq \max(N_f,N_g)$. Motsvarande resultat gäller inte för division $f/g$ eftersom $O(g)$ endast ger en övre, inte en undre gräns.
  • Ifall $f(n)= n^2$ och $g(n)= n^3$ så gäller $f\in O(n^2)$, $g\in O(n^3)$ och $5$ är (naturligtvis?) minsta möjliga tal $p$ så att $f\cdot g \in O(n^p)$.
  • Men om $2$ är minsta möjliga tal $p_f$ så att $f\in O(n^{p_f})$ och $3$ är minsta möjliga tal $p_g$ så att $g\in O(n^{p_g})$ så följer det inte nödvändigtvis att $5$ är minsta möjliga tal $p$ så att $f\cdot g \in O(n^p)$ eftersom vi tex. kan välja \begin{align*} f(n)= \begin{cases} n^2,& \text{$n$ är udda,}\\ 0,& \text{$n$ är jämn,}\end{cases}\\ g(n)= \begin{cases} 0,& \text{$n$ är udda,}\\ n^3,& \text{$n$ är jämn,}\end{cases} \end{align*} för då gäller $f(n)g(n)=0$ för alla $n$ och $f\cdot g\in O(n^p)$ för varje $p\in \Z$.
Exempel: Hur många räkneoperationer behövs för att räkna värdet av ett polynom? [+]

Om vi skall räkna värdet av polynomet $p(x)=a_n\cdot x^n+ a_{n-1}\cdot x^{n-1}+\ldots + a_1\cdot x+ a_0$ i punkten $x=x_*$ så kan vi gå till väga tex. på följande sätt:
Vi räknar ut talen $b_j$, $j=n,n-1,\ldots,0$ så att
$b_n=a_n$
$b_{n-1}= a_{n-1}+b_n\cdot x_*$
$b_{n-2}= a_{n-2}+b_{n-1}\cdot x_*$
$\quad \vdots $
$b_0 = a_0+ b_1\cdot x_*$
så att $p(x_*)=b_0$.

Här gör vi alltså högst $n$ additioner och $n$ multiplikationer dvs. sammanlagt $2\cdot n$ räkneoperationer så detta antal hör till mängden $O(n)$ ifall polynomets gradtal är högst $n$.

Hur många jämförelser behövs för att hitta det tal vars ordningsnummer i storleksordning är $p$ i en mängd med $n$ tal? [+]

Ifall $p=1$ (det minsta talet) eller $p=n$ (det största talet) så räcker det med $n-1$ jämförelser men vad är svaret i det allmänna fallet?

Vi skall nu visa att om $1\leq p \leq n$ så hör antalet jämförelser som behövs till mängden $O(n)$, dvs. det finns en konstant $C$ så att antalet jämförelser är högst $Cn$ och vi bryr oss inte speciellt mycket om vad denna konstant är:

  • Vi antar att det behövs högst $Ck$ jämförelser då det i mängden finns $k< n$ tal.
  • Vi delar talen i delmängder i vilka det finns högst $5$ tal: Inga jämförelser.
  • Vi bestämmer medianerna i dessa mängder: $O(n)$ jämförelser.
  • Vi bestämmer medianernas median: $C (\frac 15 n+1)$ jämförelser.
  • Vi delar tal i två mängder, beroende på om de är större eller mindre än medianernas median: $O(n)$ jämförelser.
  • Bådadera av dessa mängder innehåller högst $(1-\frac 15\cdot \frac 12\cdot 3)n+O(1)= \frac 7{10}n+ O(1)$ tal!
  • Antalet element i dessa mängder avgör i vilken av dem talet vi söker finns (om det nu inte är medianernas median) och vilket dess ordningsnummer är så vi kan hitta det i rätt delmängd: $C\frac 7{10}n + CO(1)$ jämförelser.
  • Vi har använt jämförelser där $c_0$ är en konstant (som inte beror på $C$).
  • Ifall $n\leq 20 c_0$ kan vi ordna talen genom att göra högst $n^2\leq (20 c_0) n$ jämförelser (men de facto räcker det högst $n\log_2(n)$ jämförelser) och på det sättet hitta talet vi söker så om vi väljer $C\geq 20c_0$ så behöver vi högst $Cn$ jämförelser då $n\leq 20c_0$ och då $n>20 c_0$ dvs. $c_0<\frac 1{20}n$så ser vi, eftersom $ c_0\leq\frac 1{20}C$, att vi behöver jämförelser och induktionsresonenmanget fungerar.

Senast modifierad: G. Gripenberg,