Hieronder staat een artikel dat ik onlangs gevonden. Dit een van de meest uitgebreide beschrijvingen van Pinverificatie Waarde (PVV) hacken.
Ik dacht dat ik zou replicatieonderzoek het hier voor mijn lokale referentie.
Als reactie hebben plaatsgevonden met betrekking tot de grammatica gebruikt in de oorspronkelijke tekst, ik hebben een aantal van de voor de hand liggende fouten met behoud van de context van het oorspronkelijke materiaal.
http://69.46.26.132/ ~ biggold1/fastget2you/tutorial.php
--- Original Tekst ----
Voorwoord
Heeft u ooit de vraag wat er zou gebeuren als u uw creditcard of betaalkaart en iemand vindt. Zou deze persoon te kunnen trekken contanten uit een geldautomaat gissen, ergens, uw PIN-code? Bovendien, als je die vindt iemand de kaart zou u proberen te raden de PIN en neemt de kans om wat te gemakkelijk geld? Natuurlijk het antwoord op beide vragen is "nee". Dit werk heeft geen betrekking op de tweede vraag, is het een kwestie van persoonlijke ethiek. Hierbij probeer ik naar het antwoord op de eerste vraag.
Alle gegevens die worden gebruikt voor dit werk is openbaar en vrij kunnen worden gevonden op internet. De rest is een kwestie van wiskunde en programmeren, dus we kunnen iets leren en heb plezier. Ik licht geen geheimen. Bovendien is de doelstelling (en definitieve sluiting) van dit werk is aan te tonen dat de PIN-algoritmen zijn nog steeds sterk genoeg om voldoende veiligheid. We weten allemaal technologie is niet het zwakke punt.
Dit werk analyseert een van de meest voorkomende PIN algoritmen, VISA PVV, gebruikt door vele ATM-kaarten (krediet-en debetkaarten) en probeert uit te vinden hoe resistent is om PIN-raden aanvallen. Door "raden" bedoel ik niet de keuze van een willekeurige PIN en probeert haar in een ATM. Het is bekend dat het algemeen zijn wij van drie opeenvolgende proeven om de juiste PIN-code, als we niet ATM houdt de kaart. Zoals VISA-PIN is vier cijfers lang is het gemakkelijk afleiden dat de kans op een willekeurige PIN gissen is 3 / 10000 = 0,0003, lijkt laag genoeg om veilig te zijn, het betekent dat je moet verliezen uw kaart meer dan drieduizend keer ( of verlies van meer dan drieduizend kaarten tegelijk:) totdat er een redelijke kans op verlies van geld.
Wat ik eigenlijk bedoeld met "gissen" was het breken van de PIN-algoritme zodat enkele kaart kan je meteen weten de bijbehorende pincode. Daarom is dit document studies die mogelijkheid, het analyseren van het algoritme, en stelt een methode voor de aanval. Tenslotte geven we een instrument waarmee de aanval en de huidige resultaten over de geschatte kans om het systeem. Merk op dat, zolang andere bancaire veiligheidsgerelateerde algoritmen (andere PIN-formaten zoals IBM PIN of kaart validatie handtekeningen zoals CVV of CVC) zijn vergelijkbaar met VISA PIN, is deze analyse kan worden gedaan yielding bijna dezelfde resultaten en conclusies.
VISA PVV-algoritme
Een van de meest voorkomende PIN-algoritmes is de VISA Pinverificatie Prijs (PVV). De klant krijgt een pincode en een magneetstrip kaart. Gecodeerd in de magneetstrip is een vier-cijferige nummer, genaamd PVV. Dit nummer is een cryptografische handtekening van de PIN-en andere gegevens in verband met de kaart. Wanneer een gebruiker zijn / haar pincode de ATM leest de magneetstrip, codeert en stuurt deze informatie naar een centrale computer. Er een proces PVV wordt berekend met behulp van de klant opgegeven PIN-code en de kaart van informatie met een cryptografisch algoritme. Het proces PVV wordt vergeleken met de PVV op de kaart opgeslagen, indien zij voldoen aan de centrale computer keert terug naar de ATM-vergunning voor de transactie. Zie in meer detail.
De beschrijving van de PVV-algoritme kan worden gevonden in twee documenten in verband met de vorige pagina. Samenvattend bestaat in de versleuteling van een 8-byte (64 bit) string van gegevens, de zogenaamde Transformed Security Parameter (TSP), met DES-algoritme (DEA) in elektronische code reserveren modus (ECB) met behulp van een geheime 64-bits sleutel. De PVV is afgeleid van de output van de encryptie, dat een 8-byte string. De vier cijfers van de PVV (van links naar rechts) stemmen overeen met de eerste vier decimalen (van links naar rechts) van de output van DES toen beschouwd als een 16 hexadecimale tekens (16 x 4 bits = 64 bits) string. Als er geen vier decimale cijfers onder de 16 hexadecimale karakters dan de PVV is voltooid genomen (van links naar rechts) niet decimale karakters en decimalizing ze door gebruik te maken van de conversie A-> 0, B-> 1, C-> 2, D -> 3, E-> 4, F-> 5. Hier is een voorbeeld:
Uitgang van DES: 0FAB9CDEFFE7DCBA
PVV: 0975
De strategie van vermijding decimalization door het overslaan van personages tot vier decimalen zijn gevonden (wat gebeurt er met zijn bijna alle tijden zoals we zullen zien) is heel slim, omdat het voorkomt dat een belangrijke vertekening in de verdeling van de cijfers die is bewezen te worden fataal voor andere systemen, hoewel het effect op dit systeem zou veel lager zijn. Zie ook een gerelateerd probleem is niet van toepassing is op VISA PVV.
De TSP, gezien als een 16 hexadecimale tekens (64 bits) string, wordt gevormd (van links naar rechts) met de 11 meest rechtse cijfers van de PAN (card nummer) met uitzondering van de laatste cijfers (check digit), een cijfer 1 tot 6 die kiest de geheime sleutel versleutelen en ten slotte de vier cijfers van de PIN. Hier is een voorbeeld:
PAN: 1234 5678 9012 3445
Toets keuzehandel: 1
PIN: 2468
TSP: 5678901234412468
Uiteraard het probleem van het breken VISA PIN-code bestaat in het vinden van de geheime sleutel voor het versleutelen van DES. De methode daarvoor is om een brute kracht zoeken van de belangrijkste ruimte. Merk op dat dit niet de enige methode, zou men kunnen proberen te vinden van een zwakte in de DEA, veel geprobeerd, maar deze oude norm is nog steeds op grote schaal wordt gebruikt (nu vervangen door AES en RSA, hoewel). Dit toont het is stevig genoeg, zodat brute kracht is de enige haalbare methode (er zijn enkele beter aanvallen, maar niet praktisch in ons geval, voor een overzicht zie LASEC memo en voor het vuile details zie Biham & Shamir 1990, Biham & Shamir 1991, Matsui 1993, Biham & Biryukov 1994 en Heys 2001).
De sleutel keuzehandel cijfer werd zeer waarschijnlijk ingevoerd ter dekking van de mogelijkheid van een belangrijk compromis. In dat geval krijgen ze gewoon van de uitgifte van nieuwe kaarten met een andere toets selector. Oudere kaarten kunnen worden vervangen door nieuwe of simpelweg het ATM kan transparante schrijven van een nieuw PVV (overeenkomend met de nieuwe sleutel en het houden van dezelfde PIN) volgende keer dat de klant gebruik maakt van zijn / haar kaart. Voor het schudden van de veiligheid voor alle gebruikers moeten worden gesteld om hun pincodes, maar het zou pijnlijk zijn voor de bank om de reden, dus zeer waarschijnlijk zouden zij niet een dergelijk verzoek.
De voorbereiding van de aanval
Een brute kracht aanval bestaat uit het versleutelen van een TSP met bekende PVV met behulp van alle mogelijke encryptie sleutels en vergelijken elk verkregen PVV met de bekende PVV. Wanneer er een match is gevonden hebben we een kandidaat-sleutel. Maar hoeveel toetsen we moeten proberen? Zoals we al boven de toets is 64 bits lang, dit zou betekenen dat we moeten proberen 2 ^ 64 sleutels. Dit is echter niet waar. Eigenlijk slechts 56 bits zijn effectief in het DES-sleutels, want een beetje (het minst significante) van elk octet was historisch voorbehouden als controlesom voor de anderen; in de praktijk deze 8 bits (een voor elk van de 8 octets) worden genegeerd.
Daarom is de DES sleutel ruimte bestaat uit 2 ^ 56 sleutels. Als we proberen al deze toetsen vinden we slechts een wedstrijd, die overeenkomt met de bank geheime sleutel? Zeker niet. Krijgen we veel bijpassende sleutels. Dit komt doordat de PVV is slechts een klein deel (een kwart) van de DES-uitgang. Bovendien is de PVV is ontaardde omdat sommige van de cijfers (die tussen 0 en 5 na de laatste, gezien van links naar rechts, cijfer tussen de 6 en 9) kan afkomstig zijn van een decimale cijfers of uit een decimalized hexadecimale cijfers van de DES-uitgang. Zo veel sleutels zal een DES output levert aan dezelfde bijpassende PVV.
Wat kunnen we doen om de echte sleutel tot die andere valse positieve sleutels? We hebben gewoon te versleutelen een tweede verschillende TSP, ook bekend met de PVV, maar met alleen de kandidaat-sleutels die heeft een positieve matching met de eerste TSP-PVV talencombinatie. Er is echter geen garantie zullen we niet krijgen weer veel valse positieven met de echte toets. Als dat zo is, moeten we een derde TSP-PVV pair, herhaal het proces en zo voort.
Voordat we beginnen onze aanval hebben we te weten hoeveel TSP-PVV paren zullen we nodig hebben. Voor dat we hebben voor het berekenen van de kans voor een willekeurige DES output te leveren een bijpassende PVV alleen door toeval. Er zijn verschillende manieren voor de berekening van dit nummer en hier zal ik gebruik maken van een eenvoudige benadering gemakkelijk te begrijpen, maar dat vereist enige achtergrond in de wiskunde van waarschijnlijkheid.
Een kans kan altijd worden gezien als de verhouding tussen gunstige gevallen aan mogelijke gevallen. In ons probleem is het aantal mogelijke gevallen wordt gegeven door de permutatie van 16 elementen (de 0 tot en met F hexadecimale cijfers) in een groep van 16 van hen (de 16 hexadecimale cijfers van het DES-uitgang). Deze wordt gegeven door 16 ^ 16 ~ 1,8 * 10 ^ 19 die uiteraard samen met 2 ^ 64 (verschillende getallen van 64 bits). Deze reeks getallen kan worden opgedeeld in vijf categorieën:
Degenen met ten minste vier decimalen (0 tot 9) tussen de 16 hexadecimale cijfers (0 t / m F) van het DES-uitgang.
Die met precies slechts drie decimalen.
Die met precies slechts twee decimale cijfers.
Die met precies alleen een decimaal cijfer.
Degenen zonder decimalen (alle tussen A en F).
Laten we eens berekenen hoeveel getallen tot in elke categorie. Als we het etiket van 16 hexadecimale cijfers van het DES-uitgang als X1 van X16 dan kunnen we etiket de eerste vier decimalen van een bepaald aantal van de eerste categorie als Xi, xj, XK en XL. Het aantal verschillende combinaties met dit profiel wordt bepaald door het product 6 I-1 * 10 * 6j-i-1 * 10 * 6k-j-1 * 10 * 6-LK-1 * 10 * 1616-l wanneer de 6 ' s zijn afkomstig uit het aantal mogelijkheden voor een A tot F cijfers, de 10's afkomstig zijn van de mogelijkheden voor een 0 tot 9 cijfers, en de 16 komt van de mogelijkheden voor een 0 tot en met F cijfer. Nu is de totale aantallen in de eerste categorie is gegeven door de som van dit product over I, J, K, L 1 tot 16, maar met i <j <k <l. Als je wat wiskunde werk zie je dit gelijk aan het product van 104 / 6 met de sommering over i 4 tot 16 van (i-1) * (i-2) * (i-3) * 6i-4 * 16 16-i ~ 1,8 * 1019.
En het aantal gevallen in de tweede categorie wordt bepaald door de sommering over I, J, K 1 tot 16 met i <j <k van het product 6i-1 * 10 * 6j-i-1 * 10 * 6k-j -1 * 10 * 616-k waarin u kunt werken, is te zijn 16! / (3! * (16-13)!) * 103 * 13 6 = 16 * 15 * 14 / (3 * 2) * 103 * 613 = 56 * 104 * 613 ~ 7,3 * 1015. Ook voor de derde categorie hebben we de sommering over I, J 1 tot 16 met i <j van 6 i-1 * 10 * 6j-i-1 * 10 * 616-j die gelijk is aan 16! / (2! * (16-14)!) * 102 * 614 = 2 * 103 * 615 ~ 9,4 * 1014. Nogmaals, voor de vierde categorie hebben we de sommering over i van 1 tot 16 van 6i-1 * 10 * 616-i = 160 * 615 ~ 7,5 * 1013. En tot slot het bedrag van de gevallen in de vijfde categorie wordt gegeven door de permutatie van zes elementen (A tot F cijfers) in een groep van 16, dat is, 616 ~ 2,8 * 1012.
Ik hoop dat u na de berekeningen tot dit punt, het harde deel is gedaan. Nu als een bewijs dat alles goed is kan je som van het aantal gevallen in de 5 categorieën en zien gelijk aan het totaal aantal mogelijke gevallen hebben we berekend vóór. Heeft de verrichtingen met behulp van 64-bits getallen of afronding (voor praalwagens) of overloop (voor integers) fouten zullen niet toestaan dat u het exacte resultaat.
Tot nu toe hebben we berekend van het aantal mogelijke gevallen in elk van de vijf categorieën, maar we zijn geïnteresseerd in het verkrijgen van het aantal gunstige gevallen plaats. Het is heel makkelijk om de laatste uit de voormalige als dit is alleen de vaststelling van de combinatie van de vier decimale cijfers (of de vereiste hexadecimale cijfers als er geen vier decimale cijfers) van de PVV in plaats van hen vrij. In de praktijk betekent dit dat u de 10 de in de bovenstaande formule in 1's en het vereiste bedrag van 6's in 1's als er geen vier decimalen. Dat wil zeggen, we hebben tot het verdelen van het eerste resultaat met 104, de tweede met 103 * 6, de derde met 102 * 62, het vierde door een 10 * 63 en de vijfde met 64. Dan is het aantal positieve gevallen in de vijf categorieën zijn ongeveer 1,8 * 1015, 1,2 * 1012, 2.6 * 1011, 3,5 * 1010, 2,2 * 109 respectievelijk.
Nu zijn wij in staat te krijgen wat is de kans voor een DES-uitgang om een PVV bij toeval. We hoeven alleen maar om de vijf nummers van gunstige gevallen en delen door het totale aantal mogelijke gevallen. Hiermee verkrijgen we dat de kans is zeer ongeveer 0.0001 of een op de tienduizend. Is het vreemd dat goed afgerond resultaat? Helemaal niet, kijk dan maar eens op de nummers we hierboven berekende. De eerste categorie overheerst door verschillende ordes van grootte van het aantal gunstige en mogelijke gevallen. Dit is vrij intuïtief als het lijkt duidelijk dat het zeer onwaarschijnlijk is niet met vier decimalen (10 kans van 16 procent cijfers) van 16 hexadecimale cijfers. We zagen eerder dat de relatie tussen het aantal mogelijke en gunstige gevallen in de eerste categorie was een deling door 10 ^ 4, dat is waar onze resultaat p = 0,0001 vandaan komt.
Ons doel voor al deze berekeningen was om uit te vinden hoeveel TSP-PVV paren moeten we voeren een succesvolle brute kracht aanval. Nu zijn wij in staat voor de berekening van het verwachte aantal valse positieven in een eerste zoeken: het zal het aantal proeven keer de kans voor een willekeurige vals positieve, dat wil zeggen t * p t = 2 ^ 56, de omvang van de belangrijkste ruimte. Dit komt neer op ongeveer 7,2 * 10 ^ 12, een vrij groot aantal. Het verwachte aantal valse positieven in de tweede zoeken (beperkt tot de positieve sleutels gevonden in het eerste zoekresultaat) zal (t * p) * p, voor een derde zoekopdracht wordt ((t * p) * p) * p en enzovoort. Dus voor n zoekt het verwachte aantal valse positieven zal t * p ^ n.
We kunnen het verkrijgen van het aantal zoekopdrachten te verwachten gewoon een valse positieve van de uiting van de vergelijking t * p ^ n = 1 en voor het oplossen van n. Dus n is gelijk aan de logaritme op basis van p 1 / t, die door de eigenschappen van logaritmen zij rendementen n = log (1 / t) / log (p) ~ 4.2. Omdat we niet kunnen doen een fractionele zoeken is het handig om rond dit getal. Therefore what is the expected number of false positives if we perform five searches? It is t * p^5 ~ 0.0007 or approximately 1 out of 1400. Thus using five TSP- PVV pairs is safe to obtain the true secret key with no false positives.
The attack
Once we know we need five TSP- PVV pairs, how do we get them? Of course we need at least one card with known PIN , and due to the nature of the PVV algorithm , that’s the only thing we need. With other PIN systems, such as IBM, we would need five cards, however this is not necessary with VISA PVV algorithm . We just have to read the magnetic stripe and then change the PIN four times but reading the card after each change.
It is necessary to read the magnetic stripe of the card to get the PVV and the encrypting key selector. You can buy a commercial magnetic stripe reader or make one yourself following the instructions you can find in the previous page and links therein. Once you have a reader see this description of standard magnetic tracks to find out how to get the PVV from the data read. In that document the PVV field in tracks 1 and 2 is said to be five character long, but actually the true PVV consists of the last four digits. The first of the five digits is the key selector. I have only seen cards with a value of 1 in this digit, which is consistent with the standard and with the secret key never being compromised (and therefore they did not need to move to another key changing the selector).
I did a simple C program, getpvvkey.c, to perform the attack . It consists of a loop to try all possible keys to encrypt the first TSP, if the derived PVV matches the true PVV a new TSP is tried, and so on until there is a mismatch, in which case the key is discarded and a new one is tried, or the five derived PVVs match the corresponding true PVVs, in which case we can assume we got the bank secret key, however the loop goes on until it exhausts the key space. This is done to assure we find the true key because there is a chance (although very low) the first key found is a false positive.
It is expected the program would take a very long time to finish and to minimize the risks of a power cut, computer hang out, etc. it does checkpoints into the file getpvvkey.dat from time to time (the exact time depends on the speed of the computer, it’s around one hour for the fastest computers now in use). For the same reason if a positive key is found it is written on the file getpvvkey.key. The program only displays one message at the beginning, the starting position taken from the checkpoint file if any, after that nothing more is displayed.
The DES algorithm is a key point in the program, it is therefore very important to optimize its speed. I tested several implementations: libdes, SSLeay, openssl, cryptlib, nss, libgcrypt, catacomb, libtomcrypt, cryptopp, ufc-crypt. The DES functions of the first four are based on the same code by Eric Young and is the one which performed best (includes optimized C and x86 assembler code). Thus I chose libdes which was the original implementation and condensed all relevant code in the files encrypt.c (C version) and x86encrypt.s (x86 assembler version). The code is slightly modified to achieve some enhancements in a brute force attack : the initial permutation is a fixed common steep in each TSP encryption and therefore can be made just one time at the beginning. Another improvement is that I wrote a completely new setkey function (I called it nextkey) which is optimum for a brute force loop.
To get the program working you just have to type in the corresponding place five TSPs and their PVVs and then compile it. I have tested it only in UNIX platforms, using the makefile Makegetpvvkey to compile (use the command “make -f Makegetpvvkey”). It may compile on other systems but you may need to fix some things. Be sure that the definition of the type long64 corresponds to a 64 bit integer. In principle there is no dependence on the endianness of the processor. I have successfully compiled and run it on Pentium-Linux, Alpha-Tru64, Mips-Irix and Sparc-Solaris. If you do not have and do not want to install Linux (you don’t know what you are missing ;-) you still have the choice to run Linux on CD and use my program, see my page running Linux without installing it.
Once you have found the secret bank key if you want to find the PIN of an arbitrary card you just have to write a similar program (sorry I have not written it, I’m too lazy :) that would try all 10^4 PINs by generating the corresponding TSP, encrypting it with the (no longer) secret key, deriving the PVV and comparing it with the PVV in the magnetic stripe of the card . You will get one match for the true PIN . Only one match? Remember what we saw above, we have a chance of 0.0001 that a random encryption matches the PVV . We are trying 10000 PINs (and therefore TSPs) thus we expect 10000 * 0.0001 = 1 false positive on average.
This is a very interesting result, it means that, on average, each card has two valid PINs: the customer PIN and the expected false positive. I call it “false” but note that as long as it generates the true PVV it is a PIN as valid as the customer’s one. Furthermore, there is no way to know which is which, even for the ATM; only customer knows. Even if the false positive were not valid as PIN , you still have three trials at the ATM anyway, enough on average. Therefore the probability we calculated at the beginning of this document about random guessing of the PIN has to be corrected. Actually it is twice that value, ie, it is 0.0006 or one out of more than 1600, still safely low.
Results
It is important to optimize the compilation of the program and to run it in the fastest possible processor due to the long expected run time. I found that the compiler optimization flag -O gets the better performance, thought some improvement is achieved adding the -fomit-frame-pointer flag on Pentium-Linux, the -spike flag on Alpha-Tru64, the -IPA flag on Mips-Irix and the -fast flag on Sparc-Solaris. Special flags (-DDES_PTR -DDES_RISC1 -DDES_RISC2 -DDES_UNROLL -DASM) for the DES code have generally benefits as well. All these flags have already been tested and I chose the best combination for each processor (see makefile) but you can try to fine tune other flags.
According to my tests the best performance is achieved with the AMD Athlon 1600 MHz processor, exceeding 3.4 million keys per second. Interestingly it gets better results than Intel Pentium IV 1800 MHz and 2000 MHz (see figures below, click on them to enlarge). I believe this is due to some I/O saturation, surely cache or memory access , that the AMD processor (which has half the cache of the Pentium) or the motherboard in which it is running, manages to avoid. In the first figure below you can see that the DES breaking speed of all processors has more or less a linear relationship with the processor speed, except for the two Intel Pentium I mentioned before. This is logical, it means that for a double processor speed you’ll get double breaking speed, but watch out for saturation effects, in this case it is better the AMD Athlon 1600 MHz, which will be even cheaper than the Intel Pentium 1800 MHz or 2000 MHz.
In the second figure we can see in more detail what we would call intrinsic DES break power of the processor. I get this value simply dividing the break speed by the processor speed, that is, we get the number of DES keys tried per second and per MHz. This is a measure of the performance of the processor type independently of its speed. The results show that the best processor for this task is the AMD Athlon, then comes the Alpha and very close after it is the Intel Pentium (except for the higher speed ones which perform very poor due to the saturation effect). Next is the Mips processor and in the last place is the Sparc. Some Alpha and Mips processors are located at bottom of scale because they are early releases not including enhancements of late versions. Note that I included the performance of x86 processors for C and assembler code as there is a big difference . It seems that gcc is not a good generator of optimized machine code, but of course we don’t know whether a manual optimization of assembler code for the other processors (Alpha, Mips, Sparc) would boost their results compared to the native C compilers (I did not use gcc for these other platforms) as it happens with the x86 processor.
Update
Here is an article where these techniques may have been used.
http://redtape.msnbc.com/2008/08/could-a-hacker.html