LAN

A LAN/MAN interfészek szállítási rétege

Transmission Control Protocol - TCP
User Datagram Protocol - UDP
- Az UDP által nyújtott szolgálatok
- Az UDP szegmens fejlécének szerkezete

A TCP (Transmission Control Protocol)

A protokollt leíró ajánlás, szabvány elemei:

RFC 793

A TCP által nyújtott szolgálatok

A TCP feladata, megbízhatatlan (best-effort) hálózatok összekapcsolása esetén a két végpontban működő programok között megbízható, sorrendhelyes full duplex bytefolyamot biztosítson. Ebből következik, hogy a TCP két alkalmazást között logikai összeköttetést hoz létre. (Emlékeztetőül: az IP két host között hoz létre logikai összeköttetést, míg az Ethernet két szomszédos hálózati eszköz között fizikai összeköttetést létesít.) A TCP mindig két végpont közötti összeköttetést jelent, pont-többpont összeköttetést TCP-vel megvalósítani nem tudunk. Tipikus példa a webböngésző és a webszerver kapcsolata. A két végpontot azok IP-száma, míg a rajtuk futó, egymással kommunikálni kívánó alkalmazásokat a portszámok (amelyekkel tulajdonképpen interfészket jelölünk meg) azonosítják. Ez az azonosítás globálisan egyedi. Érdemes megjegyezni, hogy (i) ez az azonosító változhat az átviteli út különböző részein (lásd: NAT), illetve (ii) az azonosító egyes elemei különböző rétegekben használatosak.

A TCP menedzsmentfunkcióit tekintve befolyással van a szegmensméretre, forgalomszabályozást és torlódásvezérlést végez. Fontos látnunk, hogy ezek miatt a TCP az általa összekapcsolt alkalmazásoktól "függetlenített" adatírási és adatküldési ütemezéssel/időzítéssel/sebességgel rendelkezik. Emiatt a TCP bizonyos alkalmazások esetén nem használható megfelelően, ilyenek például a valósidejű összeköttetések.

Technikai szempontból a TCP az operációs rendszerek által vezérelt ún. socket-ek között teremt kapcsolatot, amelyek az alkalmazás szempontjából interfésznek tekinthetőek. A socketre a portszámmal hivatkozunk (lásd alább a TCP fejléc szerkezetét). A TCP protokoll működése 3 részre bontható: (i) az összeköttetés létrehozása, (ii) adatátvitel, (iii) az összeköttetés lebontása.

A TCP szegmens fejlécének szerkezete

   
          0                   1                   2                   3 
          0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |          Forrásport           |            Célport            |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |                            Sorszám                            |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |                         Nyugta sorszáma                       |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         | TCP   |   Fenn-   |U|A|P|R|S|F|                               |
         |fejrész|  tartott  |R|C|S|S|Y|I|             Ablak             |
         |hossza |           |G|K|H|T|N|N|                               |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |       Ellenőrzőösszeg         |       Sürgősségi mutató       |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |       Opciók (ha vannak)                      |   Kitöltés    |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
         |       Tényleges adatok                                        |
                                         .
                                         .
                                         .
         |                                                               |
         +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

A fejléc a fentiek szerint legalább 20 oktetből áll, az egyes elemeket bemutatjuk az alábbiakban:

Forrásport (Source Port) - 16 bites szám, amely a küldő portot és ezáltal a küldő alkalmazást vagy processzt azonosítja. A lehetséges portszámokat három csoportra oszthatjuk:
- 0...1023 (0x3FF) - "jól ismert portok" Pl: 80: World Wide Web HTTP, 53: Domain Name System
- 1024...49151 (0xBFFF) - regisztrált portok (IANA website)
- 49152...65535 (0xFFFF) - dinamikus vagy privát portok, átmeneti használatra egy kliens-szerver kapcsolatban
A regisztrált portszámok menedzselése az Internet Assigned Numbers Authority (IANA) feladata.
Célport (Destination Port) - A fentinek megfelelően kiválasztott port azonosítója a címzettnél. A forrás és a cél portszáma, illetve IP-számaik együttesen globálisan egyedi módon azonosítják az egyes TCP összeköttetéseket.
Sorszám (Sequence Number) - Ez a 32 bites szám a szegmens első adatbyte-jának a sorszáma, az egész a kommunikációt egységesen kezelve. A csupa egyes érték után a számláló átfordul.
Nyugta sorszáma (Acknowledgement Number) - Ha az ACK vezérlőbit értéke 1, akkor az ebben a mezőben megadott 32 bites szám annak a byte-nak a sorszáma, amit a szegmens küldője a vevőtől vár.
TCP fejrész hossza (Data Offset vagy Header Length) - A fejléc teljes hossza 32 bites szavakban (vagyis 4 byte-os egységekben) számolva. Opciók nélkül az értéke 5, míg a TCP fejléc hosszának maximuma 60 byte lehet. Az szabványban az eredeti elnevezés a Data Offset, utalva arra, hogy az Opciók a legkisebb lehetséges TCP fejléc és az utána következő adatblokk között helyezkedhetnek el, így az fejléc elejéhez képest mekkora eltolással érhetjük el az adatot. Ez a mező szükséges, hiszen az Opciók jelenlétére egyedül ez utal.
Fenntartott (Reserved) - Későbbi használtra fenntartott 6 bit, értéke kötelezően csupa 0.
Vezérlő bitek (Control Bits vagy Flags) - 6 bit az alábbi sorrendben:
- URG - Urgent Pointer - Ha az értéke 1, akkor a vevőnek figyelembe kell vennie a Sürgősségi mutató (Urgent Pointer) mező értékét.
- ACK - Acknoledgement - Ha értéke 1, akkor a Nyugta sorszáma (Acknowledgement Number) mező valós értékkel rendelkezik.
- PSH - Push Function - Ha az értéke 1, akkor a vevőnek a lehető leghamarabb továbbítania kell a szegmenst a fogadó alkalmazásnak. A szegmens tartalma lehet például egy vezérlő üzenet, aminek meg kell előznie a normál adatfolyamot.
- RST - Reset the Connection - Azt jelzi a vevőnek, hogy a küldő törölte az összeköttetést. A sorban álló adatcsomagok törölhetőek és a lefoglalt pufferek felszabadíthatóak. A szegmens sorszáma és a nyugta sorszáma alapján a vevő figyelmen kívül hagyhatja a RST parancsot.
- SYN - Synchronize sequence numbers - Ha értéke 1, akkor azt jelzi, hogy a küldő "szinkronizálni" szeretné a sorszámokat. Az összeköttetés létrehozásakor használatos.
- FIN - No more data from sender - Ha értéke 1, akkor azt jelzi a vevőnek, hogy ebben az összeköttetésben a küldő nem küld több adatot.
Ablak (Window) - A TCP forgalomszabályozása során használt változó, megmondja, hogy a vevő mennyi adatot képes még fogadni. A lehetséges 65535 byte nem túl nagy, a "Window Scale" opció segítségével növelhető.
Ellenőrzőösszeg (Checksum) - A küldő által számított 16 bites ellenőrzőösszeget a vevő is kiszámítja. Ha a két szám egyezik, akkor a nagy valószínűséggel az IP csomag hibamentes. A számítási mód: 16 bites egységenként egyes komplemens aritmetika szerint összeadjuk a szegmens elemeit és az összeg egyes komplemensét írjuk a CRC mezőbe. A számításnál egy úgynevezett pszeudófejlécet is figyelembe veszünk, ami sorrendben a forrás és a célpont IP címét, egy csupa 0 byte-ot, a belső protokoll jelzését 8 biten (jelen esetben értéke 6 a TCP miatt) és a TCP szegmens hosszát 16 biten ábrázolva. Ezt a 96 bitet a TCP szegmens elé tesszük, az ellenőrző összeg mezőjét csupa 0-val töltjük fel, majd elvégezzük az összegzést és az eredményt beírjuk az ellenőrző összeg mezőjébe.
Sürgősségi mutató (Urgent Pointer) - A sürgősen feldolgozandó (a vevő alkalmazás felé mihamarabb továbbítandó) adatok utáni byte-ra mutató pointer. A szegmensen belül relatívan értelmezendő.
Opciók (Options) - Az opciók leírása 8 bites egységekben történik. Két lehetőségünk van: (i) egy oktetnyi opciómegjelölés vagy (ii) egy oktetnyi opciómegjelölés, egy oktetnyi opcióhosszúság és utána az opcióhoz tartozó paraméterek. Néhány érdekesebb opció (elől az opciómegjelölés, utána hossz értéke és a paraméterek):
- 0 (8 bit) - az opciólista vége, nem lesz több opció.
- 1 (8 bit) - nincs működés, kitöltés az opciók között.
- 2, 4, SS (32 bit) - a maximális szegmensméret megadása.
- 3, 3, S (24 bit) - "window scale" alkalmazása.
- 4, 2 (16 bit) - szelektív nyugtázás (Selective ACKnowledgement - SACK) engedélyezése.
- 5, N, BBBB, EEEE, ... (változó hosszúságú, N értéke lehet 10, 18, 26 vagy 34) - szelektív nyugtázás. Az első két byte után jönnek az nyugtázott blokkok kezdő (Begin) és befejező (End) mutatói.
- 8, 10, TTTT, EEEE - időbélyeg. Az első két byte után jön a küldött időbélyeg (Timestamp) és a vett időbélyeg visszaküldése (Echo).
A 2-es, a 3-as és a 4-es opciók csak SYN jelzőbites szegmensekben használhatóak.
Kitöltés (Padding) - Mivel az opciók mérete változó lehet, viszont a fejlécnek 32 bites szavakból kell állnia, ezért ha 0-kkal töltjük fel, ha szükséges.

Megjegyzendő, hogy az RFC 3168 további két jelzőbitet definiált az URG bit elé (így a Fenntartott mezőben csak 4 bitnyi hely maradt), sorrendben a CRW (Congestion Window Reduced) és az ECE (ECN Echo) biteket, amelyeknek a TCP továbbfejlesztett torlódáskezelési mechanizmusával kapcsolatban van jelentősége. A TCP állapotdiagramja látható az alábbi ábrán (Forrás: Wikimedia):

A TCP kapcsolat felépítése

Minthogy a TCP összeköttetés orientált (connection oriented) hálózati rétegbeli protokoll, így mielőtt a TCP felhasználásával adatot szeretnénk átvinni két különböző számítógépen futó alkalmazás között, kapcsolatot kell felépítenünk. A TCP kapcsolatot kezdeményező felet kliensnek (client host) nevezzük, míg a másik felet kiszolgálónak (server host) hívjuk. A TCP kapcsolat létrehozását - amit gyakran hívnak angol terminológiával 3-way-handshake-nek - az alábbi ábra szemléleti:

A ábráról leolvasható, hogy az egyes szegmensekben melyik flag-ek 1 értékűek, illetve megjelöltük a sorszámokat és a nyugták sorszámait, ahol ezek érdekesek lehetnek. A kezdeti sorszámokat (ISN - Initial sequence Number) véletlenszerűen választjuk. Ennek oka egy lehetséges támadás kivédése (bővebben lásd RFC 1948).

Az ábrán látható módon a kapcsolatfelépítéskor határozzuk meg a maximális szegmensméretet (Maximum segment Size - MSS), ami a TCP szegmensben található alkalmazási rétegbeli adat maximális mérete. Az MSS értéke függ a TCP implementációtól (amit meghatároz az operációs rendszer), de legtöbbször konfigurálható (amint az ábrán látható is) a megfelelő Opció fejlécelem használatával. Az aktuális értéket annak megfelelően szokták beállítani, hogy az IP fragmentációt elkerüljük. Az IP fragmentációra akkor kerül sor, ha az IP csomag mérete meghaladja az adatkapcsolati réteg által a PDU méretére engedélyezett maximumot (Maximum Transmission Unit - MTU). A fragmentációt lehetőség szerint el akarjuk kerülni, mivel újraküldés esetén extra forgalmat generál. Emiatt az MSS értéke igazodni szokott az MTU-hoz. A jelenlegi Interneten az IP általában Ethernet felett fut (pontosabban EthernetII keretekbe csomagoljuk az IP csomagokat), amelynek MTU-ja 1500 byte. Bizonyos eszközgyártók lehetővé teszik ún. Jumbo-frame-ek használatát, amelyek esetén az MTU 9000 byte is lehet, ez azonban csak LAN-okon fordulhat elő, border protokollok (pl. PPPoE) ezt redukálják a szokásos méretre. WLAN-on az MTU értéke 2272 byte. Minthogy a TCP két számítógépen futó alkalmazás között teremt összeköttetést, amelyek az Interneten tetszőleges helyen lehetnek, nem lehetünk biztosan abban, hogy az átviteli út során mindenűtt ugyanaz az MTU érvényes. Azért, hogy az útközbeni átcsomagolást elkerüljük, meg kell tudnunk az egész útvonalra érvényes MTU-t, ami nyilván a legkisebb MTU lesz. Az eljárást, amit az RFC 1191 (IPv4) illetve az RFC 1981 (IPv6) ír, le angol terminilógiával "Path MTU Discovery"-nek nevezzük és ICMP-t használ.

Adatfolyam átvitele TCP kapcsolaton

Az adatátviteli fázisban a TCP az alábbi szolgálatokat nyújtja:

Sorrendhelyes adatátvitel - a célcsomópont sorbarendezi a szegmenseket a sorszám alapján.
Elveszett csomagok újraküldése - a célcsomópont kumulatív nyugtát küld, a nem nyugtázott adatokat újraküldi a forrás.
Duplikált csomagok eldobása
Hibamentes adatátvitel - CRC használata a fejlécben.
Folyamvezérlés - a lassú vevő korlátozni tudja a küldő sebességét.
Torlódásszabályozás - a hálózat túlterhelése esetén korlátozza a küldő sebességét.

Mivel a hálózati hibák lehetőségét nem tudjuk teljes mértékben kikűszöbölni, ezért a megbízható adatátvitel csak úgy lehetséges, ha a forrás tudomást szerez arról, hogy mely szegmensek érkeztek meg és az elveszetteket újraküldi. Amint ezt a fejléc szerkezetéből kiolvashatjuk, a sorszámozás egyrészt lehetőséget ad a célpontnak a szegmensek eredeti sorrendjének helyreállítására, másrészt a nyugtázásnál a sorszámokra hivatkozva közölni tudja a forrással, hogy melyik szegmenseket kapta meg. A TCP a hatékonyság növelése érdekében lehetővé teszi, hogy egyszerre több szegmens is "kint legyen a hálózaton" (a pillanatnyilag maximálisan kint levő nyugtázatlan adatmennyiséget az "Ablak" mező értéke határozza meg), azonban a célpontnak az adott porthoz rendelt tárolói végesek és a feldolgozást többnyire mégiscsak az összefüggő bytefolyamon tudjuk elvégezni, így törekednünk kell arra, hogy a szegmensek "nagyjából" abban a sorrendben érkezzenek, ahogy elküldtük őket. Emiatt a nyugtázás is az addig megérkezett összefüggő adatmennyiségre utal: a nyugta sorszám annak a byte-nak a sorszáma, amely az addig vett összefüggő byte-folyam után következne. Ha a nyugták alapján a forrás arra a következtetésre jut, hogy egy szegmens elveszett, akkor azt újraküldi. A legegyszerűbb esetben a célpont minden érkezett szegmens után küld nyugtát, azonban ez nem a leghatékonyabb megoldás. Kevesebb hálózati erőforrást veszünk igénybe, ha a nyugtát valamelyest késleltetjük (delayed acknowledgement). Az ún. "piggyback acknowledgement" megoldás jól alkalmazható, ha a TCP forgalom a klienes és a szerver között szimmetrikus. Ekkor a nyugtát az ellenirányba menő adatcsomag fejlécében küldjük. Ha nincs a másik irányba forgalom, akkor is lehetőségünk van arra, hogy a nyugtát ne pontosan csomagonként küldjük, hanem valamelyest ritkábban. (Legalább 500 msec-ként és legalább minden második vett szegmens után kell nyugtát küldeni. Lásd még: RFC 1122.)

A jelenleg érvényes ajánlások szerint az implementációknak már kötelezően támogatniuk kell szelektív nyugtázást (SACK). Ebben az esetben az Opció mezőt vesszük igénybe és egy vagy több összefüggő sorszámtartományt tudnuk nyugtázni. Ez a megoldás az újraküldés hatékonyságát jelentősen javítja.

A TCP forgalomszabályozása

Az egyidőben nyugtázatlan adatmennyiséget tehát az "Ablak" hirdeti meg (Advertised Window). Ennek változtatásával a célpont egyértelműen a forrás tudtára adhatja, hogy mennyi adatot képes még fogadni, vagyis megakadályozza, hogy egy gyors küldő elárassza a vevőt (folyamvezérlés - flow control). Amikor a csomagok sorrendben, hibátlanul érkeznek, akkor az ablak mérete tulajdonképpen állandó (vagy csak kissé ingadozik a késleltetett nyugta miatt), ugyanakkor a kezdőpontja folyamatosan emelkedik ("csúszik" - innen az elnevezés). Erre az önszabályozó jellegre az angol termiológiában a "self clocking" kifejezéssel hivatkoznak. Ha nem sorrendhelyesen érkeznek a csomagok, akkor a nyugta sorszáma (vagyis az ablak kezdőpontja) változatlan, ugyanakkor a mérete csökken, hiszen a sorrenden kívül érkezett csomagokat eltároljuk (amennyiben az ablakon belülre esnek, egyébként eldobjuk). Ugyancsak eldobjuk a duplikált csomagokat. Ilyen módon, a csúszó ablakkal ellátott vevőpuffer szolgál a szegmensek sorrendjének helyreállítására. Az adatfolyam elveszett részeinek helye üresen marad az ablakban, a nyugtákkal jelezzük a hiányt és a pótlólag megérkező szegmensekről kumulatív nyugtát küldünk, így lesz az adatátvitel megbízható. A csúszó ablak (Sliding Window) használatát könnyen megérthetjük az alábbi ábrából és képletekből.

A megbízható és sorrendhelyes adatátvitel feltételei:

Minden byte-ot sorszámozunk.
Kumulatív nyugtát használunk.
Az adó oldalon
- LastByteAcked <=LastByteSent
- LastByteSent <= LastByteWritten
- A LastByteAcked és a LastByteWritten közötti sorszámmal rendelkező byte-okat tárolnunk kell.
A vevő oldalon
- LastByteRead < NextByteExpected
- NextByteExpected <= LastByteRcvd + 1
- A NextByteRead és a LastByteRcvd közötti sorszámmal rendelkező byte-okat tárolnunk kell.

A folyamvezérlés megvalósításának szabályai

Adó buffer mérete : MaxSendBuffer
vevő buffer mérete : MaxRcvBuffer
A vevő oldalon
- LastByteRcvd - NextBytteRead <= MaxRcvBuffer
- AdvertisedWindow = MaxRcvBuffer - (LastByteRcvd - NextByteRead) - Ez jelzi a vevő szabad pufferkapacitását.
Az adó oldalon
- LastByteSent - LastByteAcked <= AdvertisedWindow
- EffectiveWindow = AdvertisedWindow - (LastByteSent - LastByteAcked) - Ez adja meg, hány byte-ot küldhet még a forrás.
- LastByteWritten - LastByteAcked <= MaxSendBuffer
- Ha (LastByteWritten - LastByteAcked) + y > MaxSendBuffer, akkor a forrás nem küldhet adatot.

Az újraküldés időzítése

Mivel a TCP megbízható átvitelt nyújt, minden olyan szegmenst újraküldünk, amire egy meghatározott időn belül nem érkezik nyugta. Minden szegmenshez egy újraküldési időzítőt kapcsolunk, amely az RTO (Retransmission Timeout) lejárta után újraküldi a szegmenst. Az RTO-t a kommunikáció két végpontja közötti kétirányú késleltetés (RTT - Round Trip Time) alapján határozzuk meg, azonban az Internet két tetszőlegesen kiválasztott végpontja között az több nagyságrendet átfogó tartományba eshet az RTT, sőt két kiválasztott host között időben is jelentős ingadozást mutathat a késleltetés alakulása, vagyis az RTT meghatározása meglehetősen nehéz feladat lehet, aminek megoldására az idők folyamán egyre jobb javaslatok születtek:

Az eredeti algoritmus szerint minden szegmens/nyugta pár esetén mértük az aktuális körbefordulási időt (SampleRTT) amelyekből egy súlyozott összeget számítottunk:

EstimatedRTT = a*EstimatedRTT + b*SampleRTT,

ahol a+b = 1 és a értéke 0.8 és 0.9, míg b értéke 0.1 és 0.2 között van.

Az időzítőt (RTO) az EstimatedRTT alapján a következőre választjuk:

TimeOut = 2 * EstimatedRTT

A Karn/Partridge algoritmus módosította az eredeti, mivel felismerték, hogy az újraküldött csomagok esetén a SampleRTT nem valós infromációt hordoz (lásd az alábbi ábrát), ezért az újraküldött csomagokat nem szabad figyelembe venni az RTT becslésénél. Ugyanakkor ez önmagában további problémát generál, hiszen ha feltételezünk egy olyan helyzetet, ahol az átviteli késleltetés nagyon hirtelen (két szegmens között) jelentősen megnövekszik, akkor a fenti szabály oda vezetne minket, hogy az RTT-t többé nem frissítenénk. Ezért alkalmazzuk az "exponenciális kihátrálást" (exponential backof), ami azt jelenti, hogy minden újraküldés esetén az RTO-t kétszeresére növeljük:

new_TimeOut = old_TimeOut*2.

Ez az eljárás a gyakorlatban biztosítja a hálózat stabilitását.

A Jacobson/Karels algoritmus Van Jacobson 1988-as cikkében jelent meg először. A cikk tulajdonképpen több algoritmust tárgyal, amely később RFC-kben közzétéve hivatalos szabvánnyá váltak. Az algoritmusok - bár különböző területeket érintettek - valamennyien az Internet 1986 októberétől kezdődő sorozatos összeomlásaira kínáltak megoldást. Az összeomlások oka a torlódás volt (congestion collapse - (C) John Nagle), mivel annak kezelésére a korábbi szabványok nem készültek fel megfelelően. (Példaként leírhatjuk, hogy az RTT becslésére szolgáló eredeti algoritmus nagyjából 30%-os terhelésig működött.)

A torlódás nem csak az átbocsátóképességet csökkenti - Jacobson példája: 32 kbps-ról 40 bps-ra csökkenő sávszélesség két, egymástól 400 yardra levő számítógép között, amelyek között 3 IMP hop (Interface Message Processor - az ARPAnet hálózati eleme) található -, hanem a végül megérkező csomagok késleltetésének a szórását is jelentősen megnöveli. Az pedig könnyen belátható, hogy ha az RTT szórása nagy, akkor az RTO-nak jóval nagyobbnak kellene lennie az RTT átlagánál. Így a következő szabályokat használjuk:

Difference = SampleRTT - EstimatedRTT

EstimatedRTT = EstimatedRTT + ( d * Difference)

Deviation = Deviation + d ( |Difference| - Deviation)), ahol d egy 0 és 1 közötti tört.

Az RTO beállításánál vegyük figyelembe a szórást:

Timeout = u * EstimatedRTT + q * Deviation, ahol u = 1 és q = 4 .

A TCP torlódáskezelése (TCP Congestion Control)

A torlódás, mint ezt korábban írtuk, nem az Internet kezdeti jelenségei közé tartozik, hanem csak a '80-as évek második felétől tapasztalták meg egyre nagyobb méretekben. A megoldási javaslatokat Jacobson a már említett cikkében publikálta. A TCP torlódáskezelés négy, egymáshoz kapcsolódó algoritmusból áll, amelyeket szabványként az RFC 2581 írt le, jelenleg ebben a tárgyban az RFC 5681 érvényes. Az algoritmusokban megjelenik két új változó. Az egyik "congestion window" (torlódási ablak) néven, amelyet többnyire a "cwnd" (vagy a "CongWin") rövidítéssel jelölünk és ezentúl a küldő ablakaként a vevő meghirdetett ablaka és a torlódási ablak közül a kisebbet kell figyelembe vennünk. A másik változó a "slow start threshold" (ssthresh - lassú indítási küszöb), amely két algoritmus közötti váltásnak a határpontja. További fontos újdonság, hogy a csomagvesztést a torlódás jelének tartjuk és a csomagvesztésre különbözőképpen regálunk aszerint, hogy az időzítő lejárta alapján észleljük azt vagy 3 duplikált nyugta alapján tekintjük a csomagot elveszettnek.

A négy eljárás a következő:

Slow Start - Lassú indulás - Ebben a fázisban a torlódási ablak minden nyugta után egy MSS-sel növekszik, ami a gyakorlatban a cwnd megduplázódását jelenti RTT-ként. (A késleltetett nyugtázás ezt a növekedési ütemet természetesen lassítja.) A fázis addig tart, amíg a küldési ablak az SSthresh értékét el nem éri (természetesen lehetséges, hogy sosem történik ez meg, hiszen küldés sebességét a vevő is tudja korlátozni, a küldési ablak az AdvWindow és a cwnd minimuma) vagy csomagvesztést nem tapasztalunk. Az újonnan felépülő TCP összeköttetések esetén a cwnd értékét 1 szegmensre, míg az ssthresh értékét 65535 byte-ra szoktuk állítani. Ha a küldési ablak eléri az ssthresh értékét, akkor a torlódás elkerülés fázisába lépünk át. Ha csomagvesztést tapasztalunk 3 duplikált nyugta alapján, akkor a gyors újraküldési fázisba lépünk át az aktuális küldési ablak felét tekintve új ssthresh-nak és az a cwnd értékét az ssthresh-ra állítjuk (Multiplicative Decrease), ha az újraküldési időzítő lejár, akkor a lassú indulás fázisát kezdjük újra, úgy hogy az ssthresh értéke az aktuális küldési ablak fele lesz, míg a cwnd értékét 1 MSS-re állítjuk.
Congestion Avoidance - Torlódás elkerülés - A torlódás elkerülés fázist azért használjuk, hogy a hálózaton elérhető legnagyobb sebességet minél kisebb ingadozásokkal keressük meg. A lassú indulás exponenciális növekedésével szemben itt RTT-ként lineárisan nő a cwnd. Amikor ebbe a fázisba lépünk, az ssthresh értéke a fele annak a küldési ablakénak, amelyben a torlódást észleltük, míg a cwnd értékét az ssthresh-ra állítjuk. Ezek után minden újonnan érkező ACk-ra a cwnd értékét MSS*MSS/cwnd-vel növeljük. Ez praktikusan RTT-nként 1 MSS-sel növeli a cwnd-t (Additive Increase). Ha újabb csomagvesztés történik és ezt a duplikált nyugták alapján észleljük, akkor a gyors újraküldési fázisba lépünk át az aktuális küldési ablak felét tekintve új ssthresh-nak és az a cwnd értékét az ssthresh-ra állítjuk (Multiplicative Decrease), ha az újraküldési időzítő lejár, akkor a lassú indulás fázisát kezdjük újra, úgy hogy az ssthresh értéke az aktuális küldési ablak fele lesz, míg a cwnd értékét 1 MSS-re állítjuk.
Fast Retransmit - Gyors újraküldés - Újraküldjük az elveszett csomagot. Ha jön új adatot nyugtázó ACK, akkor a gyors felépülés fázisa következik, ha az időzítő lejár, akkor a lassú indulás fázisa következik.
Rast Recovery - Gyors felépülés - Minthogy tudjuk, hogy az adatforgalom nem állt le teljesen, amikor ebbe a fázisba kerülünk, így nem kell a lassú indulás fázisába lépnünk, helyette magasabb cwnd értékkel folytathatjuk a küldést. Általában a gyors újraküldéssel együtt implementálják a következőképpen:
1. Amint fentebb írtuk, a 3 duplikált nyugta után az ssthresh értékét az aktuális cwnd felére állítjuk és újraküldjük az elveszett szegmenst. Az újraküldés után a cwnd értékét ssthresh + 3 MSS-re állítjuk.
2. Ha újabb duplikált ACK érkezik, egy MSS-nyivel növeljük a cwnd értékét és küldjünk egy szegmest, ha a cwnd értéke lehetővé teszi .
3. Ha új adatra vonatkozó ACk érkezik, akkor cwnd értékét az ssthresh-ra állítjuk. Ennek a nyugtának a gyors újraküldés során elküldött szegmenst kell nyugtáznia az újraküldéshez képest RTT elteltével. Ha a csomagvesztés egyedi volt, akkor ez az ACK nyugtázza az összes többi csomagot is, amelyeket duplikált nyugták vétel előtt küldtünk. Ha így van, akkor a torlódás elkerülés fázisba lépünk, ha nem, akkor maradunk a gyors felépülés fázisban.

A TCP torlódáskezelése felfogható egy állapotgépként is. Az alábbi táblázat tájékozat arról, hogy az egyes állapotok között milyen átjárás lehetséges.

állapot Esemény TCP küldő tevékenysége Megjegyzés

Slow Start (SS) ACK érkezik korábban nem nyugtázott adatra CongWin = CongWin + MSS, Ha (CongWin > Threshold), akkor "Congestion Avoidance" állapotba lépünk át. CongWin duplázódik minden RTT alatt.

Congestion Avoidance (CA) ACK érkezik korábban nem nyugtázott adatra CongWin = CongWin+MSS * (MSS/CongWin) Additive Increase, a CongWin 1 MSS-sel nő minden RTT alatt

SS vagy CA Csomagvesztést észlelünk: 3 duplikált ACK érkezett Threshold = CongWin/2, CongWin = Threshold, "Congestion Avoidance" állapotba lépünk Fast recovery, Multiplicative Decrease. A CongWin nem eshet 1 MSS alá.

SS vagy CA TimeOut Threshold = CongWin/2, CongWin = 1 MSS, "Slow Start" állapotba lépünk. A lassú indulás fázis kezdődik.

SS vagy CA Duplikált ACK érkezik Növeljük a nyugtázott csomag duplikált ACK számlálóját A CongWin és a Threshold változatlanok

állapot	Esemény	TCP küldő tevékenysége	Megjegyzés
Slow Start (SS)	ACK érkezik korábban nem nyugtázott adatra	CongWin = CongWin + MSS, Ha (CongWin > Threshold), akkor "Congestion Avoidance" állapotba lépünk át.	CongWin duplázódik minden RTT alatt.
Congestion Avoidance (CA)	ACK érkezik korábban nem nyugtázott adatra	CongWin = CongWin+MSS * (MSS/CongWin)	Additive Increase, a CongWin 1 MSS-sel nő minden RTT alatt
SS vagy CA	Csomagvesztést észlelünk: 3 duplikált ACK érkezett	Threshold = CongWin/2, CongWin = Threshold, "Congestion Avoidance" állapotba lépünk	Fast recovery, Multiplicative Decrease. A CongWin nem eshet 1 MSS alá.
SS vagy CA	TimeOut	Threshold = CongWin/2, CongWin = 1 MSS, "Slow Start" állapotba lépünk.	A lassú indulás fázis kezdődik.
SS vagy CA	Duplikált ACK érkezik	Növeljük a nyugtázott csomag duplikált ACK számlálóját	A CongWin és a Threshold változatlanok

Érdemes tudni, hogy az IP hálózatokon előforduló torlódás kezelésére egyéb, nem a TCP-ben megvalósított lehetőségeink is vannak, amelyek azonban valamilyen módon mégiscsak kapcsolódnak hozzá. Ilyen lehetőségek például a RED (Random Early Detection) vagy az ECN (Explicit Congestion Notification), amely utóbbival kapcsolatban a két új TCP jelzőbitet már említettük.

A TCP igazságossága (fairness)

Ha egy szűk linken több TCP folyam is osztozik, akkor elvárhatjuk, hogy azok a kezdeti paramétereiktől függetlenül igazságosan osztozhassanak az erőforrásokon. Ezt a torlódás elkerülésnél használatos Additive Increase/Multiplicative Decrease sebességszabályozás biztosítja, amint ez az alábbi ábráról megérthető.

Ennek eredményeképpen alakul ki a TCP közismertnek mondható fűrészfog alakú sebességgörbéje, ami alapján a TCP átlagsebességére vonatkozólag is egy egyszerű becslést tehetünk: 0.75*cwnd/RTT. Természetesen a becslés akkor igaz, ha a torlódási ablak korlátozza az átvitelt és az átviendő byte-folyam elég hosszú ahhoz, hogy a lassú indulás fázis hossza elhanyagolható legyen a torlódás elkerülés fáziséhoz képest. Az fűrészfog görbe nem csak a sebességet jellemzi, hanem alakja megfeleltethető a cwnd méretének illetve a vevőpufferben található adatmennyiségnek is.

A TCP sorszámok és nyugták

Látnunk kell azt, hogy a TCP menedzsmentfuncióinak a célja az, hogy a rendelkezésre álló átviteli kapacitást kihasználva a lehető legnagyobb hatékonyságot (throughput-ot) érjünk el, vagyis a linket a lehető leginkább telítetnünk kell. Az eddigi tárgyalt részleteken túl még szót kell ejtenünk az Ablak és a Sorszámról, vagyis arról, hogy ezek használata miként befolyásolja a fenti cél elérhetőségét.

Az Ablakról elmondtuk, hogy a vevő tud ebben a fejlécelemben a küldőnek üzenni, és megadhatja benne az általa még fogadható byte-ok számát (Advertised Window), amely maximum 64kB lehet, hiszen az Ablak mező 16 bites. Ennek a méretnek és a torlódási ablaknak a minimuma adja meg a küldő számára, hogy mennyi nyugtázatlan adatot küldhet el összesen. Tegyük fel, hogy a vevő megfelelő teljesítményű és a hálózat terheletlen, az RTT pedig 50 msec. Egyszerűen megmutatható, hogy a forrás csak akkor tudja telíteni a linket, ha az AW maximuma nagyobb lehet, mint az ún. "sávszélesség-késleltetés szorzat" (Bandwitdh-Delay Product - BDP) értéke. Az alábbi táblázat néhány lehetséges sávszélesség értékére vonatkoztatva megadja a BDP-t.

Bandwidth [Mbps] BDP (RTT=50 msec) [kB] Átfordulási idő

T1 (1.5 Mbps) 9 6.4 óra

ADSL (5 Mbps) 31 1.9 óra

Ethernet (10 Mbps) 61 57 perc

T3 (45 Mbps) 275 13 perc

Fast Ethernet (100 Mbps) 610 5.7 perc

STS-3 (155 Mbps) 946 3.7 perc

STS-12 (622 Mbps) 3796 55.2 másodperc

Gigabit Ethernet (1000 Mbps) 6104 34.4 másodperc

Bandwidth [Mbps]	BDP (RTT=50 msec) [kB]	Átfordulási idő
T1 (1.5 Mbps)	9	6.4 óra
ADSL (5 Mbps)	31	1.9 óra
Ethernet (10 Mbps)	61	57 perc
T3 (45 Mbps)	275	13 perc
Fast Ethernet (100 Mbps)	610	5.7 perc
STS-3 (155 Mbps)	946	3.7 perc
STS-12 (622 Mbps)	3796	55.2 másodperc
Gigabit Ethernet (1000 Mbps)	6104	34.4 másodperc

Látható, hogy a 10 Mbps-os vonal még betölthető a 64 kB-os Ablakkal, nagyobb sebességű link azonban már nem. A probléma megoldására a TCP fejléc opciói közül a Window Scale (RFC 1323) használatos: itt egy 8 bites mező áll a rendelkezésünkre, amelynek értéke azt adja meg, hogy hány bittel toljuk el (shift) el a vett értéket balra (illetve a küldendő értéket jobbra). Az így nyert lehetőségeket azonban nem használhatjuk ki teljes mértékben: maximálisan 14 lehet a window scale factor értéke, ami nagyjából 1 GB-os ablakértéknek felel meg.

A Sorszám egy 32 bites átforduló szám, amelynek a kezdeti, véletlenszerűen választott sorszámértékhez képesti eltolása megegyezik az adott szegmens első adatbyte-jának az átviendő byte-folyamban elfoglalt pozíciójával. A vett szegmens sorszáma alapján dönt a vevő arról, hogy ez beleillik-e a vételi ablakába vagy el kell-e dobnia. A 32 bittel nagyjából 4 GB adat címezhető meg, ami manapság nem számít nagyon soknak. A fenti táblázat 3. oszlopában az adott sávszélességű linken mért átfordulási időt (az az idő, ami alatt a teljes sorszámkészletet elhasználjuk - time to wrap around) tüntettük fel. Ezen kívül még arra is figyelnünk kell, hogy a küldő és a vevő ablaka nem pontosan fedi egymást, így némi számolgatás után arra juthatunk, hogy a SenderWindowSize < (MaxSeqNum +1)/2 feltétel betartása szükséges. Látható, hogy nagyobb sebességű hálózatokon ez már viszonylag rövid idő alatt bekövetkezik. A megoldási lehetőséget erre a problémára megint a TCP opciók között kereshetünk. Az RFC 1323-ben leírt Timestamp (Időbélyeg) opció használatával lehetőségünk van arra, hogy akár nagy ablakméret mellett is megkülönböztessünk azonos sorszámmal érkező szegmenseket. Fontos tudnunk, hogy az időbélyeg időegységeket számol, a számlálót a SYN-SYN/ACK üzenetváltás során tudjuk inicializálni és szinkronizálni. Az időalap megválasztásával kacsolatban a szabvány szerint 1 msec és 1 sec közötti értéket kell használni, a gyakorlatban néhányszor 10 és néhányszor 100 msec közötti időalapot szoktak választani. Ez az Időbélyeg opció másik célra való használatára megfelelő, ugyanis arra is lehetőségünk van az időbélyeg visszaküldésével, hogy az RTT-t viszonylag pontosan mérni tudjuk. A mérés eredményét mind az RTO számítására, mind a torlódás előrejelzésére használhatjuk.

Sequence Number Plot

A TCP sorszámokat az idő függvényében ábrázolva szemléletes képet kapunk az adott TCP folyam jellegzetességeiről. A léptékhelyes diagramon nemcsak a torlódáskezelés egyes lépései követhetőek nyomon, hanem a TCP összeköttetésre vonatkozó jellemző mennyiségeket is le tudjuk olvasni (például: MSS, RTT-k, RTO, ablakméretek, stb.).

A TCP kapcsolat lezárása

A TCP adatfolyam utolsó byte-jának átvitele után az összeköttetést le kell zárnunk. A lezárás a két fél által kölcsönösen elküldött FIN jelzőbites szegmensekből és az arra adott nyugtákból áll, vagyis alapvetően 4 üzenetet használunk, ami nem is meglepő, ha arra gondolunk, hogy a TCP full-duplex összeköttetést nyújt. Egy lehetséges esetet mutat be az alábbi ábra. Érdemes megjegyezni, hogy az állapotgráfban nem azonnal a második nyugta után kerülünk CLOSED állapotba, hanem még ki kell várni egy időzítő lejártát.

Az ábráról leolvasható, hogy előfordulhat olyan eset, amikor az egyik fél már lezárta az összeköttetést, míg az a másik oldalról nyitva marad (half open). Lehetséges az is, hogy a két fél kölcsönösen le akarja zárni az összeköttetést, vagyis a FIN szegmenst mindketten úgy küldik el, hogy a másiktól még nem kaptak ilyent. Végül meg kell említenünk, hogy a mai implementációkban gyakran használják a TWH megfelelő változatát, vagyis az aktív FIN-re adott nyugta és a passzív FIN egy szegmensben megy.

Nagysebességű TCP-változatok

A hálózati sávszélesség folyamatos növekedése felvetette a link telíthetőségének a problémáját, amiről már korábban szó esett illetve azt a problémát, hogy a visszacsatolás ideje (vagyis az RTT) kisebb állományok esetén összemérhető a teljes állomány átviteléhez szükséges idővel, azonban a slow start miatt ez utóbbi jelentősen hosszabb lesz a szükségesnél. Ennek két következménye, hogy a torlódásvezérlés és a forgalomszabályozás nem lesz hatékony, illetve a link kihasználtsága kicsi lesz. E fentiekben már bemutattunk néhány lehetőséget, amelyekkel a nagy sebességű hálózatok nyújtotta átviteli lehetőségeket jobban ki tuydjuk használni, azonban sokak szerint a TCP javítgatása helyett új algoritmusokra lenne szükség. Az ún. nagysebességű TCP-változatok közül néhány ismertebbet az alábbi táblázatban foglaltunk össze.

A protokoll neve Típus Kik, mikor javasolták Főbb jellemzők
HighSpeed TCP csomagvesztés alapú S. Floyd, International Computer Science Institute (ICSI), Berkeley University of California, 2003. AIMD
Scalable TCP csomagvesztés alapú T. Kelly, CERN & University of Cambridge, 2003. MIMD
BIC TCP / CUBIC csomagvesztés alapú I. Rhee et al., Networking Research Lab, North Carolina State University, 2004. és 2005. jó kihasználtság, fairness és stabilitási tulajdonságok
FAST TCP késleltetés alapú S. Low et al., Netlab, California Institute of Technology, 2004. (ma: FastSoft Inc.) bíztató fairness tulajdonságok
TCP Westwood mérés alapú M. Y. Sanadidi, M. Gerla et al., High Performance Internet Lab, Network Research Lab, University of California, Los Angeles (UCLA), 2001 és 2005 között több változat, különböző becslési módszerek
Compound TCP hibrid K. Tan et al., Microsoft Research, 2005. AIMD + késleltetés alapú komponens
XCP explicit torlódásjelzés D. Katabi et al., Massachusetts Institute of Technology (MIT), 2002. routerek módosítása szükséges

A protokoll neve	Típus	Kik, mikor javasolták	Főbb jellemzők
HighSpeed TCP	csomagvesztés alapú	S. Floyd, International Computer Science Institute (ICSI), Berkeley University of California, 2003.	AIMD
Scalable TCP	csomagvesztés alapú	T. Kelly, CERN & University of Cambridge, 2003.	MIMD
BIC TCP / CUBIC	csomagvesztés alapú	I. Rhee et al., Networking Research Lab, North Carolina State University, 2004. és 2005.	jó kihasználtság, fairness és stabilitási tulajdonságok
FAST TCP	késleltetés alapú	S. Low et al., Netlab, California Institute of Technology, 2004. (ma: FastSoft Inc.)	bíztató fairness tulajdonságok
TCP Westwood	mérés alapú	M. Y. Sanadidi, M. Gerla et al., High Performance Internet Lab, Network Research Lab, University of California, Los Angeles (UCLA), 2001 és 2005 között	több változat, különböző becslési módszerek
Compound TCP	hibrid	K. Tan et al., Microsoft Research, 2005.	AIMD + késleltetés alapú komponens
XCP	explicit torlódásjelzés	D. Katabi et al., Massachusetts Institute of Technology (MIT), 2002.	routerek módosítása szükséges

Az UDP (User Datagram Protocol)

A protokollt leíró ajánlás, szabvány elemei:

RFC 768

Az UDP által nyújtott szolgálatok

Az UDP felhasználói datagram protokoll. Lehetővé teszi a felhasználóknak, hogy összeköttetés felépítése és lebontása nélkül üzenetet küldhessenek. Nem garantálja sem az üzenetek kézbesítését, sem azok sorrendtartását.

Az UDP szegmens fejlécének szerkezete

          bytes (20)   from IPv4 keret
              +--------------------------------+
            2 | Source Port                    |
              +--------------------------------+
            2 | Destination Port               |  Pl: 5004 (avt-profile-1) RTP media data
              +--------------------------------+
            2 | Length  (8 byte header + max.  |
              |          65527 byte data)      |
              +--------------------------------+
            2 | Checksum (header+data)         |
              +--------------------------------+

0000  70 cd 70 64 08 00 45 b8                           ..)../.`p.pd..E.
0010  00 c8 9e 11 00 00 3e 11 c1 48 98 42 f5 ab 98 42   ......>..H.B...B
0020  f5 e2 46 b0 13 8c 00 b4 00 00 80 00 3d 7c 00 28   ..F.........=|.(
0030  0c 40 d4 7b 28 21 f9 f7 fc ff 7b 7d fd 7c 7c 78   .@.{(!....{}.||x
0040  7a fc 7c 7a 7f fd fd 7e ff fd fb f8 f3 f0 f3 f7   z.|z...~........
0050  fc fb f8 fa 7d 76 78 79 77 77 78 7a 7b 7b 7c 7d   ....}vxywwxz{{|}
0060  7e fe fe fd f9 f7 fb fc f7 f9 fb fb fc fa fa fd   ~...............
0070  fd fb fb fa fd fe fd fc f8 fa fd fb fc fd fb fa   ................
0080  f8 f8 fe fe fa fa fb fd 7e 7b 79 78 79 7f fa fe   ........~{yxy...
0090  7c 7f 7e 7c 7e 7f 7b 7b 7c 7a 78 78 78 74 75 79   |.~|~.{{|zxxxtuy
00a0  7c 7c 7c 7f fc f9 fa fc fa f9 f9 fc 7d 7e fb f9   |||.........}~..
00b0  f7 f9 7f 7e fe fd fb fb fc fe 7d fc f9 fe 7e 7b   ...~......}...~{
00c0  7c 7b 7b 7a 79 7b 7a 7c 7c 79 7c 7a 79 7b 7c 7b   |{{zy{z||y|zy{|{
00d0  7b 7b 7b 7c 7b 7b                                 {{{|{{