Python ļauj mums strādāt ar attāliem failiem, iespējams, tas šādā veidā neizklausās loģiski, bet attālie faili šajā gadījumā ir nekas cits kā vaicājumi tīmekļa lapām no mūsu Python programmas, iemesls tam var būt no vaicāšanas līdz REST tīmekļa pakalpojumi kas ļauj mums iegūt vērtības līdz GŪT vai tieši vaicājiet lapām un manipulējiet ar to saturu.
Lai to panāktu, mēs izmantosim dažas no daudzajām tās piedāvātajām bibliotēkām Python darbam ar tīkliem, tādējādi novēršot tehniskos šķēršļus un koncentrējoties tikai uz to, cik tas ir svarīgi mūsu programmēšanas loģikā.
urllib un urllib2
Šīs divas grāmatnīcas urllib Y urllib2 Tie ļauj mums piekļūt failiem tīklā tā, it kā tie būtu mūsu vietējā vidē, izmantojot vienkāršu funkcijas izsaukumu, tas mums var kalpot daudzām lietām, piemēram, lai mēs varētu izmantot tīmekli un tā saturu mūsu programmā sagatavot ziņojumus par to, ko mēs tajā varam atrast.
Šīs divas bibliotēkas ir līdzīgas, to atšķirība ir tāda urllib2 tas var būt nedaudz sarežģītāks, un, ja mēs vienkārši vēlamies veikt vaicājumu bez papildu ietekmes, mēs varam izmantot urllib, bet, ja mēs vēlamies veikt kādu autentifikācijas procesu vai izmantot sīkfailus, tad urllib2 tā var būt pareizā izvēle mūsu programmai.
Tā kā mēs teorētiski zinām, kas mums vajadzīgs un kāpēc mums tas ir vajadzīgs, apskatīsim nelielu koda piemēru, lai mums būtu skaidrs, ko mēs varam darīt, nākamajā piemērā mēs atvērsim Web no mūsu programmas un pēc tam ar regulārām izteiksmēm mēs izmantosim tā satura saiti urllib:
>>> no urllib importēt urlopen >>> webpage = urlopen ('http://www.python.org') >>> importēt atkārtoti >>> text = webpage.read () >>> m = re.search ( "Apmācība", teksts, atkārtota. IEVĒRTĪBA) >>> m.group (1)
Mēs ejam soli pa solim, vispirms no mūsu importētās urllib bibliotēkas urlopen, tad mēs izveidojam mainīgo ar nosaukumu tīmekļa lapa kurā tiks iekļauts rezultāts urlopen Ko mēs darīsim ar oficiālo vietni Python, ar šo mēs jau importējam re Lai strādātu ar regulārajām izteiksmēm, mēs sakām, ka teksts ir mainīgais, kas satur lapas saturu, mēs veicam meklēšanu ar regulāru izteiksmi un, visbeidzot, mēs grupējam rezultātu, kuram vajadzētu izdrukāt:
http://docs.python.org/
Tas ir pateicoties metodei urlopenTas, ko jūs darāt, ir tas, ka tas ļauj mums strādāt ar Web lapu tā, it kā tas būtu faila objekts, tādā veidā mēs varam izmantot daudzas funkcijas, kuras mēs varam izmantot ar šāda veida objektiem, pat ja mēs vēlamies, ka mēs varam lejupielādēt lapu un strādājiet to no mūsu vietējiem ļoti vienkāršā veidā, izmantojot šo metodi urlretrieve sekojoši:
urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')Vienīgais, ko mēs darām, ir kā otro parametru nodot ceļu vietējā vidē, kur fails ar lapas kopiju ir jāsaglabā bez lielām grūtībām.
Ar to mēs pabeidzam šo apmācību, jo redzam, ka sarežģītāka darba veikšana, piemēram, lapu izmantošana mūsu programmās ir diezgan vienkārša, pateicoties bibliotēkām Python.
Vai jums patika šī apmācība un palīdzējāt tai?Jūs varat apbalvot autoru, nospiežot šo pogu, lai sniegtu viņam pozitīvu punktu