Pirmie soļi ar Kasandru

Satura rādītājs
Kasandra ir Datu bāze NoSQL jaudīgs un mērogojams. Tā ir atvērtā koda, un tās arhitektūra ir veidota kā izplatīta sistēma, kurā visi mezgli tajā ir vienādi, tādējādi ļaujot datus izplatīt visos klasteru mezglos.
Uzglabāšana Kasandra ir definēts kā atslēga / vērtība kur atslēga var kartēt uz vienu vai vairākām vērtībām. Ir Datu bāze orientēta uz rindu ierakstiem, kur katra rinda tiek identificēta pēc tās atslēgas, un šīs sistēmas īpatnība ir tāda, ka rindu var saglabāt vairāk nekā vienā mezglā.
Pirms turpināt instalēšanu Kasandra mūsu sistēmā mums ir nedaudz jāzina par tās arhitektūru Datu bāze, tādā veidā mēs zināsim, kas mums ir un ko mēs varam sasniegt.
Kad mēs runājam par informācijas replikāciju, viens no pirmajiem jautājumiem, ko mēs sev uzdodam, ir šāds: Cik kopiju mums vajag? Uz šo jautājumu Kasandrā nav viegli atbildēt, taču mums jāpatur prātā, ka šis faktors norāda vienā rindā saglabāto mezglu skaitu.
Piemēram, replikācijas koeficients 2 garantē, ka klastera mezglu informācijas kopijas būs divas. Izvēloties replikācijas koeficienta otro vērtību, ir labi novērst defektus attīstības vidē esošā mezglā, un tas var būt minimums ražošanas vidē, jo, ja viens mezgls nokrīt, otrs apstrādā visus pieprasījumus, tāpēc mums tas ir jādomā uzmanīgi pirms tā ieviešanas.
Atslēgas telpaKasandra ļauj mums grupēt informāciju kaut ko sauc atslēgu telpas, kur mēs varam teikt, ka šie atslēgu telpas tie ir lietojumprogrammu informācijas konteineri. Tomēr klasterim ir viena atslēgas telpa katrai lietojumprogrammai Kasandra izmantojiet šos atslēgu telpas replikācijas apstrādei.
Kolonnu ģimenePēc mūsu definēšanas taustiņu telpa, tā iekšpusē mums ir kaut kas saucams kolonnu saime, tie ir konteineri līdzīgi, bet rindu kolekcijai. Katra rinda ir sakārtota kolonnu kolekcija, un mēs varam izveidot analoģiju attiecībā uz relāciju datu bāzēm, kur kolonnu saime tie ir nedaudz līdzīgi tabulām.
Replikācijas stratēģijaIn Kasandra Ir divas informācijas atkārtošanas stratēģijas, viena no tām un tā, kuru mēs jau apskatījām, ir vienkārša stratēģija vai SimpleStrategy kas ir atbildīgs par informācijas kopēšanu uz nākamo mezglu, līdz tiek izpildīts noteiktais replikācijas koeficients. Otro stratēģiju sauc NetworkTopologyStrategy, kur tas ir labākais risinājums, ja vēlamies izplatīt informāciju vairākos datu centros.
Protokols, ko izmantoja Kasandra lai koplietotu mezglu atrašanās vietu un tiek saukta informācija par tiem klasterī Tenkas. Kur šie mezgli nepārtraukti "muld" un apmainās ar informāciju ar līdz pat 3 mezgliem klasterī.
Šim protokolam, tāpat kā citiem, ir noteikumi, lai nosūtītu pieprasījumus uz citiem mezgliem, kur mēs varam redzēt trīs tā darbības, un katrs mezgls vienmēr atkārto šīs darbības:
1- Murmurējiet uz nejauši izvēlētu aktīvu mezglu.
2- Sāciet troksni pret nejaušu lejupvērstu mezglu.
3- Šis solis nav obligāts un nosaka, ka, ja pirmajā solī izvēlētais mezgls nav sēklas mezgls, kurnējiet ar citu nejaušu sēklu mezglu.
Bet, lai pārvietotu informāciju un veiktu saziņu starp mezgliem Kasandra izmantojiet komponentu ar nosaukumu SnitchApskatīsim, ko jūs domājat.
Būtībā šī sastāvdaļa ir atbildīga par informācijas kustības pārvaldību starp mezgliem, kas vaicājumiem un replikācijai izmanto citus mezglus, pamatojoties uz dažādiem rādītājiem. Šī konfigurācija ir vienāda visiem klasteru mezgliem, tomēr tās veids var atšķirties, redzēsim, kuri no mums ir pieejami:
SimpleSnitchIzmanto vienkāršos datu centru izvietojumos un a noķert konfigurēts šādā veidā neizmanto nekādu informāciju no datu centra. Tās uzvedība ir vienkārša, un tā ir atrast nākamo mezglu.
Dinamiska šņaukšanaŠī konfigurācija uzrauga kopiju veiktspēju un izvēlas labāko, pamatojoties uz vienkāršu metriku, kas soda ilgu atbildes laiku un izvairās no mezgliem, kas saspiež jūsu informāciju.
RackInferringSnitchŠī konfigurācija izmanto IP adresi, lai noteiktu mezglu atrašanās vietu, kur IP pēdējā daļa identificē mezglu, otrā - statīvus un trešo - datu centrus.
PropertyFileSnitchTas ļauj definēt klasteru topoloģiju rekvizītu failā, parasti šī konfigurācija tiek izmantota, ja RackInferringSnitch nav piemērojams.
GossipingPropertyFileSnitchSākotnējai konfigurācijai tas izmanto rekvizītu failu un turpina ar troksni, lai nosūtītu informāciju citiem mezgliem.
Uzstādīšana Kasandra Mēs to darīsim komandā ar Windows 8, kurā mums jāatbilst noteiktām prasībām, redzēsim, kas mums nepieciešams:
1- Mums ir jābūt vismaz Java 7 instalēta mūsu sistēmā, ja mums tā nav, mēs varam lejupielādēt jaunāko versiju šajā saitē.
2- Mums papildus vajag Microsoft Visual C ++ 2008 pārdalāmā pakotne (x86).
3- Visbeidzot interneta pieslēgums, lai lejupielādētu paketi DataStax.
Pārskatot mūsu prasības, mēs dosimies uz projekta lapu un meklēsim 32 vai 64 bitu versiju, kas piemērota mūsu sistēmai:

PALIELINĀT

Ja mēs vēlamies apskatīt savienojuma dokumentāciju par Kasandra Izmantojot dažādas programmēšanas valodas, mēs varam nokļūt lapā un redzēt, kas mums ir vajadzīgs. Pēc lejupielādes mēs instalējam tāpat kā jebkuru Windows lietojumprogrammu. Ja ir svarīgi pieminēt, ka pēc šīs instalēšanas, Kasandra pēc noklusējuma tas izveidos testu kopu.
Instalējot, mūsu sistēmā ir instalēti vairāki rīki, viens no tiem ir tīmekļa saskarne Kasandra zvanīt OpsCenter, kuru mēs varam ievadīt, ja pārlūkprogrammā ievietojam šādu adresi:
 http: // localhost: 8888 / opscenter / index.html
Šī saskarne ļauj mums darīt vairākas interesantas lietas, tomēr tā nav optimālākā, ar ko strādāt Kasandra, taču šīs apmācības nolūkos ir svarīgi to zināt, redzēt, ko tā mums piedāvā, un tādējādi ir sākumpunkts, lai sāktu uzzināt datubāzes struktūru.
Pirmā lieta, ko mēs atrodam, ieejot šajā saskarnē, ir sadaļa Mērinstrumentu panelis, kur mēs varam vizualizēt dažādus veiktspējas rādītājus, piemēram, mezglu stāvokli, atmiņas ietilpību vai rakstīt pieprasījumus:

PALIELINĀT

Šajā saskarnē mēs varam izveidot jaunu kopu, šim nolūkam dodoties uz augšējo labo daļu un nospiežot Jauna kopa, kas atvērs šādu ekrānu:

Mēs ievadām pieprasītos datus un noklikšķiniet uz veidot kopu, papildus tam mēs varam vienādi pievienot mezglus nolaižamajā izvēlnē Klasteru darbības, augšējā labajā stūrī. Sadaļā Nedod, mēs varam redzēt pieejamos mezglus un datu centrus, kā arī noteiktus parametrus, piemēram, veselību, datu lielumu un pat ģenerētos brīdinājumus:

PALIELINĀT

Sadaļā Aktivitātes Mēs varam redzēt klasterī veikto darbību sarakstu, kā arī notikumu žurnālu - kaut ko diezgan noderīgu, kad esam Datu bāze:

PALIELINĀT

Tad mūsu tīmekļa saskarnē ir vissvarīgākā sadaļa, un tā ir Dati, šeit mēs varam definēt savus informācijas konteinerus, kas labāk pazīstami kā atslēgu telpas un "galdi" vai kolonnu ģimenes.
Lai izveidotu a taustiņu telpa, vispirms mums jāiet uz sadaļu Dati un tur izvēlieties opciju Pievienot, mēs ievadām nosaukumu, replikācijas stratēģiju, kurā paskaidrojam, ka tā var būt vienkārša vai tīkla topoloģija, un replikācijas koeficientu.

Mēs ietaupījām un mēs jau būtu izveidojuši savu taustiņu telpa, kā mēs atceramies, šiem konteineriem ir galvenā funkcija Kasandra y ir definēt replikācijas koeficientu. Kad mūsu konteiners ir definēts, mēs pievienosim a kolonnu saime, šim nolūkam mēs ievadām taustiņu telpu un izvēlamies opciju Pievienot. Šeit mēs ievadām nosaukumu, kolonnas veidu un salīdzinājuma veidu.

Ar to mēs jau esam izveidojuši savu kolonnu saimeKā redzam, tas ir ārkārtīgi vienkārši, tomēr šī saskarne mūs ierobežo daudzās lietās un ir tikai labs sākumpunkts iesācējiem lietotājiem, kuri vēlas saprast, kā Kasandra un kā viņš tiek galā kopas, mezgli, atslēgu telpas un kolonnu saimes.
Ar to mēs pabeidzām šo apmācību, kur mēs varējām redzēt, kāda ir arhitektūra Kasandra, tā protokols, komponenti un tā uzstādīšana. Mēs uzzinājām par struktūru, izmantojot tīmekļa saskarni, taču ar to esam pieskārušies tikai aisberga redzamajai daļai, turpmākajās apmācībās mēs pilnībā iepazīsimies ar CQL un kā strādāt profesionāli Kasandra.
wave wave wave wave wave