240 liens privés
Il est devenu courant de publier des modèles de langage de grande taille (milliards de paramètres).
qui ont été entraînés sur des ensembles de données privés.
Cet article démontre que dans de telles situations, un adversaire peut effectuer une attaque d'extraction de données d'entraînement par exemples de formation individuels en interrogeant le modèle de langage.
Nous faisons la démonstration de notre attaque sur GPT-2, un modèle de langue formé à partir de fragments de l'Internet public.
Ces exemples extraits comprennent des informations personnelles (publiques) identifiables (noms, numéros de téléphone et adresses électroniques)), des conversations IRC, des codes et des UUID 128 bits. C' est ainsi que nous avons pu extraire des centaines de séquences textuelles verbatim des données d'entraînement du modèle.
identifiables (noms, numéros de téléphone et adresses électroniques) ), des conversations IRC, des codes et des UUID 128 bits. Notre attaque est possible même si chacune des séquences ci-dessus
sont incluses dans un seul document des données d'entraînement.
Nous évaluons de manière exhaustive notre attaque d'extraction afin de comprendre les facteurs qui contribuent à la réussite de l'attaque.
comprendre les facteurs qui contribuent à son succès. Inquiétant, nous constatons que les grands modèles sont plus vulnérables que les petits modèles.
petits modèles. Nous concluons en tirant des leçons et en discutant des protections possibles pour la formation de grands modèles linguistiques.
Nous concluons en tirant des leçons et en discutant des sauvegardes possibles pour la formation de grands modèles de langage.
Memorized Leaked Podesta Emails from WikiLeaks.
We identify several memorized URLs that originated from
the leaked Podesta Emails available on WikiLeaks13. There
is only one training document that contains these memorized
URLs. Due to the nature of email, the text of one message is
often included in subsequent replies to this email. As a result,
a URL that is used (intentionally) only once can be included
in the dataset tens of times due to the replies.
https://en.wikipedia.org/wiki/Podesta_emails
Memorized Donald Trump Quotes and Tweets. The
GPT-2 training dataset was collected when the 2016 US Pres-
idential election was often in the news. As a result, we find
several instances of memorized quotes from Donald Trump,
both in the form of official remarks made as President (found
in the official government records), as well as statements made
on Twitter.
Memorized Number Sequences. We identify many ex-
amples where GPT-2 emits common number sequences.
Nearly ten examples contain the integers counting
up from some specific value. We also find exam-
ples of GPT-2 counting the squares 1, 2, 4, 8, 16,
25, 36, Fibonacci numbers 1, 1, 2, 3, 5, 8, 13, 21,
34, 55, 89, 144, 233, 377, 610, 987, or digits of π,
3.14159265358979323846264. None of these examples
should be unexpected, but the quantity of memorized number
sequences was surprising to us.
Aucun de ces exemples ne devrait être inattendu, mais la quantité de séquences de nombres mémorisées de nombres mémorisés nous a surpris..
La conclusion que je tire de cette étude est que les niveaux de retracement de Fibonacci ne représentent pas un phénomène réel. Au contraire, les retracements à l'intérieur de ces zones s'expliquent uniquement par le hasard statistique.
Avec n'importe quelle technique graphique, il y a une tendance humaine à regarder le graphique et à "ne voir" que les cas où la règle est valable. Nous ignorons la multitude de cas où la règle ne tient pas.
Je pense que c'est ce qui se passe avec Fibonacci. Un trader voit le retracement se produire entre le niveau ou près du niveau. Il peut ensuite "aligner" l'indicateur avec ces niveaux et en conclure que l'effet est bien réel alors qu'il ne l'est pas. Nous avons également constaté dans d'autres études que même des données de prix purement aléatoires peuvent créer l'impression de ce type de lignes de retournement.
C'est peut être du chinois pour la plupart de gens.. mais là Montagnier vient de confirmer une de mes réflexions à propos des vaccins ARN....
"Les gens de pfizer se sont dit que pour maintenir l'ARN messager le plus longtemps possible dans l'organisme, il faut l'enrichir en GC, (Guanine et Cytosine), les liaisons Guanine Cytosine sont plus fortes, et les liaison hydrogène que les liaisons Adésine-Uracile. La nature, a choisi de varier en utilisant un concept qui n'est pas connu. Enfin, connu des artistes, mais pas des scientifiques. Ce sont les séries harmoniques de nombre. Notamment la série de fibonacci. Les variants ont de plus en plus des séries de fibonacci. A partir du rapport Adénie-uracile sur guanine-ytosine. DOnc pourquoi par ce que le code génétique est dégénéré, le choix de codon, donc ces 3 nucléotides qui correspondent à un acide aminé, qui sont viarables, surtout le dernier. Donc on peut remplacer le C ou le G par un A ou un U sans changer le code. C'est à dire que la traduction de cet ARN au niveau des Rhibosome est lue avec les mêmes acides aminé, donc vous changez pas la protéine. C'est ça la différence. Tous les variants ont série de fibonacci et pas le vaccin.... le vaccin au contraire il est enrichi en GC pour le rendre plus stable."
→ Donc je résume. La nature utilise des bases ACGT pour le code génétique. Un codon c'est 3 bases. Chaque codon permet d'exprimer des acides aminés. Il y a 64 possibilités. Mais on ne trouve que 20 acides aminés différents. → il y a donc des synonymes.
→ chez bioNtech/Pfizer, ils ont remplacé des codons naturels du virus SarsCov2 en autre codons. Ceci pour rendre le code du vaccin plus durable. Mais là ils ont rompu l'harmonie qui règnent généralement dans un code génétique: la suite de fibonacci... (c'est comme en télécom, on ne transmet pas le code en direct, mais on utilise souvent une modulation sur une porteuse. On utilise un code qui va équilibrer le message, notamment pour des questions d'énergie et de correction d'erreur... étant ingénieur en télécom j'ai eu l'intuition de faire ce parallèle.. et voilà que ça semble se confirmer)
Donc qu'est-ce que ça donne si on ne tient pas compte de l'harmonie du nombre d'or dans un code génétique ??
Pour comprendre comment ce vaccin a été créé, voici un excellent article.
https://renaudguerin.net/posts/explorons-le-code-source-du-vaccin-biontech-pfizer-sars-cov-2/
Et voici le code du sarscov2 et en parallèle codon par codon, le code du vaccin bioNtech-Pfizer:
https://github.com/berthubert/bnt162b2/blob/master/side-by-side.csv
On voit donc les modifications faites.
Depuis des décennies, on utilise la suite de Fibonacci pour essayer de prévoir les mouvements de la bourse. Une tendance haussière ou baissière n'est jamais linéaire. Quand la tendance est vers la hausse on appelle les phases à la baisse "de correction" et quand elle est à la baisse les phases à la hausse "de rebond"
Les retracements de Fibonacci sont un outil communément utiliser pour essayer de prévoir ces corrections et ces rebonds. Ils sont automatiquement pris en comptes dans les algorithmes et sont proposés comme outils de base aux traders.
Comment sont produits les retracements?
Rappelons la suite: 1, 2, 3, 5, 8, 13, 21, 34, 55, 89
On fait le rapport entre deux nombres de Fibonacci. Deux nombres consécutifs de la séquence tendent vers le ratio d'or, par exemple 55/89 = 0.618. les autres ratios sont obtenus par le rapport entre un chiffre de la suite et un autre, non consécutif. Par exemple 34/89 = 0.382, 13/55 = 0.236, 1/2 = 0.5 et 1/1= 1.
Traduits en pourcentages les retracements de Fibonacci donnent: 23,6%, 38,2%, 50,0%, 61.8%, 100%.
Si on dépasse les 100%, on parle alors des extensions de Fibonacci (1.000, 1.382, 1.618...). On peut également mentionner les projections de Fibonacci (61,80%, 100,00%, 138,20%, 161,80%, 271,80%.)
...Souriau obtient alors ceci :
30 Soleil (29 jours)
55 Rien
85 Mercure (88 jours)
140 Rien
225 Vénus
365 La Terre
590 (1 an et sept mois) Mars (1 an et 10 mois)
955 Rien
1545 (4 ans et 3 mois) Cérès-Pallas( ceinture astér)
2500 Rien
4045 (11 ans) Jupiter ( 11 ans et 10 mois)
6545 Rien
10590 (29 ans) Saturne ( 29 ans et 5 mois)
17135 Rien
27725 (76 ans) Uranus (84 ans)
44860 Rien
72585 (199 ans) Neptune (165 ans), Pluton (248 ans)