Data jsou citlivé téma a jako datoví vědci se jich přirozeně budete hodně věnovat. Zde je několik pravidel, která byste měli vždy dodržovat.

Data jsou nesmírně cenná a jejich využití je dnes pro většinu organizací jedním z nejlepších postupů. Znalost průmyslových standardů v tomto ohledu je však nezbytná pro to, aby se datoví vědci s daty nemýlili, protože se lidé dozvídají více o jejich hodnotě.

Jako takoví musí datoví vědci přijmout bezpečné a etické postupy a přijmout ty standardizované. Místo toho, abychom zvažovali, jak hodnotná jsou pouze data, je moudré zpochybnit metody získávání a zpracování dat pro jakýkoli účel. Zde je tedy devět kodexů chování, které by měl dodržovat každý datový vědec.

1. Dodržujte předpisy

Datoví vědci musí znát předpisy na ochranu údajů, které se vztahují na určité pracovní pozice. V opačném případě můžete nevědomky porušit zákon a ohrozit sebe i ostatní. Tyto znalosti jsou tedy klíčové pro zajištění etické práce a pro zabránění neúmyslnému poškození.

Před zahájením jakékoli činnosti si proto ověřte příslušné zákony. Kromě toho nedodržujte pouze předpisy, abyste dodržovali pravidla; také usilovat o jejich hlubší porozumění. Abyste správně dodržovali předpisy, musíte vědět, proč byly umístěny a před čím chrání.

instagram viewer

Několik pozoruhodných zákonů o ochraně osobních údajů je obecné nařízení EU o ochraně osobních údajů (GDPR) a kalifornského zákona o ochraně soukromí spotřebitelů (CCPA). Mezi další patří HIIPA, DPA, PIPEDA, LGPD a mnoho průmyslových předpisů.

2. Respektujte soukromí

Adresy, e-maily a ID jsou identifikátory, které by neměly být veřejné, protože pro lidi představují skutečné riziko. Zajistěte proto, aby byly tyto údaje co nejsoukromější.

V případě odhalení by oběti mohly trpět krádeží identity nebo podvodem. Mohli by je také vydírat lidé, kteří vyhrožovali zveřejněním jejich důvěrných informací. Kromě toho mohou profesionálové utrpět poškození dobré pověsti a online obtěžování, jakmile budou zveřejněny jejich osobní preference. Ty mohou ovlivnit jejich vztahy, kariérní příležitosti a sociální postavení.

Takže s ohledem na to zkoumejte a vybírejte účinné způsoby, jak to zlepšit bezpečné online identity a zrušit identifikaci údajů. Můžete například nahradit znaky, odstranit přímé identifikátory nebo zobecnit. Tím chráníte citlivá data před kyberzločinci a zároveň pomáháte organizacím s vašimi zjištěními.

3. Odstraňte zaujatost

Datoví vědci spoléhají na to, že statistiky jsou co nejobjektivnější. Navzdory těmto snahám však zkreslení přetrvává, protože představa, že větší data jsou přesnější, je jednou z nejdůležitějších běžné mýty datové vědy.

Je na tom něco pravdy, ale bohužel velká data někdy obsahují zbytečné nebo falešné prvky a statistiky. Místo toho, abyste se zaměřovali pouze na čísla, zajistěte, aby vaše data byla čistá a reprezentativní.

Čištění nebo filtrování dat před použitím jsou vynikající metody boje proti zkreslení. Můžete například zkontrolovat chyby nebo použít stratifikované vzorkování, abyste zajistili reprezentativní data.

4. Výsledky si nevymýšlejte ani nevymýšlejte

Vytváření je forma nesprávného chování dat a podvodu při výzkumu, který zahrnuje vymýšlení zjištění a jejich nahlášení jako pravdivé.

Například datový vědec může hlásit, že u většiny členů určité věkové skupiny bylo zjištěno, že lék nemá žádné vedlejší účinky. Tato zjištění by byla smyšlená, kdyby neexistovaly žádné počáteční lékařské experimenty a shromážděná data, která by je podpořila.

Výroba má vážné a negativní důsledky pro datové vědce a ty, kteří se spoléhají na jejich práci. Mohlo by to zničit vaši důvěryhodnost, poškodit pověst vaší organizace, poškodit veřejnost nebo vás vystavit právním rizikům.

5. Nefalšujte ani nemanipulujte s důkazy

Falšování je manipulace s realitou, shromážděná data, aby vyhovovala agendě. Zatímco výrobci vytvářejí výsledky z neexistujících dat, aby podpořili svá tvrzení, falšovatelé pracují na vyvrácení skutečných a existujících dat z osobních důvodů. Aby toho dosáhli, mohou manipulovat s výzkumným zařízením, měnit nebo zcela vynechat data.

Falšování může poškodit veřejnost poskytováním nepravdivých informací ovlivňujících rozhodování v různých sektorech. Falešná studie léků by například mohla vystavit lidi zbytečným rizikům, neúčinné léčbě nebo škodlivým vedlejším účinkům. Může to také způsobit ztrátu peněz, času nebo materiálů, které by mohly být použity pro jiné účely.

Výroba a falšování jsou bezohledné praktiky s nepříznivými účinky a četnými sankcemi. Ty mohou zahrnovat pokuty, zrušení pověření, ztrátu financování výzkumu nebo uvěznění.

6. Zobrazit průhlednost

Transparentnost pro datové vědce znamená být upřímný ohledně metod používaných ke sběru, analýze a prezentaci dat. Datoví vědci by měli být otevření a připraveni sdílet své postupy s dalšími datovými vědci a účastníky studie.

Navíc musíte získat souhlas účastníků studie, protože zveřejnění výsledků bez informovaného souhlasu může účastníky různými způsoby znevážit nebo je poškodit. Mohou narušit jejich důstojnost, soukromí a autonomii nebo je vystavit škodlivým, zbytečným rizikům vyplývajícím ze studie.

Transparentnost buduje důvěru u těch, kteří spoléhají na vaše data. Zajišťuje také kvalitu dat tím, že umožňuje ostatním kontrolovat vaše výsledky.

Otevřenost mezi datovými vědci navíc podporuje spolupráci a učení. Můžete přispět k podpoře inovací tím, že budete sdílet svůj proces a komunikovat nejlepší metody vizualizace dat a techniky datové vědy kolegům a zároveň se od nich učit.

7. Sbírejte data bezpečně

Datoví vědci musí potvrdit bezpečnost metod používaných ke sběru, analýze a ukládání dat. Tím se zabrání potenciálnímu narušení dat, které může ovlivnit datové vědce a účastníky studie.

Úniky dat ohrožují osobní bezpečnost, podkopávají důvěru veřejnosti a odhalují organizační neschopnost, která má za následek ohromující finanční ztráty společnosti. Těmito ztrátami mohou být soudní spory od obětí porušení dat, méně klientů a další.

Ve světle toho musíte provést výzkum, abyste našli nejúčinnější řešení zabezpečení dat a aplikovat je. Můžete například zabezpečit připojení pomocí šifrování TLS/SSL nebo použít rotující proxy. Také můžete vynutit opatření pro řízení přístupu a vytvořit zálohy pro případ útoku. Když najdete řešení, nezapomeňte je sdílet s ostatními, abyste zajistili maximální bezpečnost.

8. Používejte algoritmy zodpovědně

Algoritmy nejsou jen nástroje pro analýzu dat. Mají silný vliv na životy, chování a příležitosti lidí. Ačkoli však pomáhají řešit problémy a vytvářet inovativní předpovědi, jsou také nedokonalé.

Pokud algoritmy nejsou pečlivě navrženy, testovány nebo nasazeny, mají sociální a etické dopady, které mohou poškodit určité skupiny lidí. Zavádějí také zkreslení, pokud jsou školeni na datech, která odrážejí stávající předsudky a mohou být nepředvídatelná. Datoví vědci je tedy musí navrhovat a používat zodpovědně.

Vždy vyberte vhodné algoritmy, otestujte jejich výkon a vysvětlete, jak fungují. Ujistěte se také, že identifikujete potenciální zdroje zkreslení a zavedete mechanismy, které v případě potřeby aktualizují nebo opravují.

9. Zvažte dlouhodobé důsledky vaší práce

Vaše práce datového vědce významně ovlivní mnoho aspektů společnosti. Vždy tedy zvažte, jak vaše modely ovlivňují lidi.

Zkuste si například položit otázku, zda vaše práce může v budoucnu udržovat předsudky a nerovnost nebo ohrozit soukromí. Dále tyto obavy přiměřeně řešte.

Všimněte si, že výhled orientovaný na budoucnost je důležitější než jakákoli korektivní metoda a přemýšlení o nadcházejících dnech je jedním z nejúčinnějších způsobů, jak činit eticky správná rozhodnutí.

Jako datový vědec musíte být etický

Jako datový vědec získáte pravomoc, která přichází s poměrnou odpovědností. Vaše dovednosti jsou vzácné, takže sedíte v popředí organizačního rozhodování.

Vaše rozhodnutí ovlivňují vše od obchodních plánů společnosti až po systémy trestního soudnictví. Takže byste je neměli dělat na lehkou váhu. Při své práci buďte vždy upřímní, etickí a pečliví, abyste ochránili lidi před existujícími etickými dilematy ve vašem odvětví a dalších technologických oborech.