|
L'article suivant écrit en septembre 1996 a été publié en 1997 dans le livre :
"Les origines astronomiques et biochimiques et la
recherche de la vie dans l'univers,"
Proc. de la 5ème Conférence Internationale de Bio-astronomie = Colloque de l'I.A.U. n°
161, par S. Bowyer et D. Werthimer, aux éditions C.B. Cosmovici (éditeur : Editrice Compositori, Bologne, Italie.)
Retour au sommaire.
Un nouveau projet SETI majeur basé sur les données du projet SERENDIP et 100 000 ordinateurs personnels.
W. T. Sullivan III (U. Washington), D. Werthimer, S. Bowyer, J. Cobb (U.Californie, Berkeley), D. Gedye, D. Anderson (Big Science, Inc.)
RÉSUMÉ.
Nous développons ici un projet SETI innovant, pour l'instant nommé SETI@home, impliquant le calcul massivement parallèle sur des ordinateurs de bureau
autour du monde. Le public sera impliqué de façon unique dans un véritable projet scientifique. Les individus téléchargeront un programme d'écran de
veille qui non seulement produira les graphiques attractifs usuels quand leur ordinateur est inactif, mais conduira également sur l'ordinateur hôte l'analyse
sophistiquée des données SETI.
Les données sont prises du récepteur du Projet SERENDIP IV et de l'étude SETI menée au radio-télescope de 305 mètres de diamètre d'Arecibo. Nous
réalisons un enregistrement continu d'un signal de 2 MHz en largeur de bande centrée sur la ligne de 21 cm de longueur d'onde de l'ion Hydrogène.
Les données de ces bandes sont alors préalablement circonscrites et morcelées par un serveur qui fournit de petits tronçons de données (50 secondes d'une
bande passante de 20 kHz, un total de 0,25 Mo) su Internet aux clients qui possèdent le logiciel d'écran de veille.
Une fois que l'ordinateur a achevé l'analyse complète du bloc de données (d'une façon bien plus détaillée que ce que fait SERENDIP normalement) un
rapport sur les meilleurs signaux candidats est renvoyé au serveur, d'où un nouveau tronçon de données est envoyé. Si 50 000 à 100 000 clients
sont réunis, la puissance de calcul sera équivalente à une fraction substantielle d'un super-ordinateur typique, et SETI@home couvrira un volume comparable
d'espace de paramètres que celui de SERENDIP IV.
Introduction.
La science, bien que pratiquement entièrement supportée par des fonds publics, a traditionnellement été menée dans des laboratoires et observatoires
non ouverts au public général. Dans une ère où le support du public à la science se développe, ce modus operandi pourrait se perdre lui-même et il
demande un réexamen. Le but du présent projet SETI, qu'on nommera pour l'instant SETI@home, est (a) de faire de la bonne science, et (b) de le faire d'une
façon qui engage et attire le public général. C'est une chance pour éduquer les participants sur comment travaille la science, aussi bien que pour leur
donner un information fiable sur le SETI (au contraire, par exemple, du film "Independence Day"). En fin de compte la communauté scientifique ne
peut tirer un profit que si le public comprends mieux l'entreprise scientifique.
Une fois opérationnel, SETI@home :
- sera la première fois que des utilisateurs d'ordinateurs ordinaires pourront participer à une expérience scientifique majeure.
- sera la plus grande application informatique distribuée jamais tentée.
- offrira à chaque participant la faible mais captivante possibilité que son ordinateur soit l'instrument de la détection d'une autre civilisation
technologique dans la Voie Lactée.
Architecture du projet et flux des données.
SETI@home est une étude menée en "ferroutage" et basée sur l'étude SERENDIP IV, qui est elle-même une
étude greffée opérant sur le télescope de 305 m d'Arecibo. SERENDIP IV, qui débutera ses opérations en 1997 sur la "galette" récemment
améliorée d'Arecibo, est décrit (en même temps que ses prédécesseurs) par [ Bowyer et al. ] (1997) ailleurs dans ce volume. L'idée de base est qu'un
récepteur et un processeur de données SERENDIP séparé "se balade" sur la plate-forme de collecte d'Arecibo alors que la radio-astronomie
classique continue à être menée normalement. Le ciel visible à Arecibo est donc étudié d'une façon pseudo aléatoire, et en fait chaque secteur du ciel
est typiquement revisité tous les 3 à 6 mois. Ces revisites sont critiques pour discriminer les interférences en radio-fréquence (I.R.F.) d'origine
humaine.
L'architecture globale de SETI@home est présentée en figure 1. A Arecibo, SETI@home enregistrera sur bande magnétique dans la bande de base une petite
portion des 183 MHz de largeur totale de bande du SERENDIP ; 2 MHz couvriront les trois cadres de repos possibles de radiations
héliocentriques, galactocentriques et de bruit de fond cosmique. Cette bande sera d'abord réduite et convertie à partir d'une fréquence d'observation
centrée sur la frange à 21 cm de l'hydrogène à 1420 MHz, idéale en terme de stratégie SETI, et libre des interférences d'origine humaine
(I.R.F.). Avec un échantillonnage sur un bit à la cadence de Nyquist, cela donne une vitesse d'enregistrement de 0,5 Mo/s, soit un D.A.T. Exabyte
Monmouth (capacité 25 Go) toutes les 11 heures, ou encore 500 bandes par ans (pour une efficacité d'observation escomptée de 70 %).
Ces bandes sont envoyées par Fed-Ex au serveur Big-Science où elles sont validées, archivées, et augmentées de paramètres d'indexation, en particulier
les positions dans le ciel et dans le temps. Seule une portion des données sera analysée, en première instance pour ce qui sera nécessaire afin de
maintenir l'alimentation des clients (voir ci-dessous). Cette portion des données sera choisie pour être à la plus petite latitude galactique possible, c.
à d., dans la direction du plan galactique comme voulu dans la "stratégie Voie Lactée" mise en avant par [ Sullivan et Mighell ] (1984).

Figure 1. Un diagramme schématique de l'architecture et du flot de données de SETI@home.
Notez que "N" se réfère au nombre d'ordinateurs participant actuellement à l'analyse.
Même si aucun signal n'apparaît au premier passage à une position donnée du ciel, Les positions du ciel qui sont (par chance) répétées seront
analysées en priorité parce qu'elles permettent de combattre les I.R.F. et de traiter la possibilité de scintillements interstellaires. Les signaux
candidats reçoivent de forts Q.I.'s (Quotients d'Intérêt) suivant le nombre de fois où ils se répètent, et de la façon dont ils se distinguent des
possibles I.R.F. par leur ajustement au motif du faisceau et par leur propriété de dérive Doppler non locale.
Chaque client travaillera à tout moment sur 0,25 Mo de données, ce qui représente 50 secondes du signal à 20 kHz. Ces largeurs de bande de
20 kHz seront créées depuis les données originales à 2 MHz par le serveur qui calculera des F.F.T.'s conduites par tables. Ces 50 secondes de
données de dérive correspondent à un secteur de ciel de 6x25 minutes d'arc (4 faisceaux indépendants, essentiels pour la discrimination des I.R.F.). Cela
signifie que chaque personne reçoit une table de 50 secondes par 20 000 Hz pour son ensemble de données de base ; l'espace requis pour le
stockage du code et des données pour analyser ce tronçon est estimé à 3 ou 4 Mo.
Du côté réception, un tronçon de 0,25 Mo demandera 1,3 s sur une liaison d'abonné T1 à 190 Ko/s, ou 2,3 minutes sur une ligne à
14,4 kbaud (suffisamment court en ligne pour ne pas décourager les clients). Une fois terminée (typiquement après quelques jours) l'analyse des
données de chaque tronçon, un court message rapportant les signaux candidats est présenté au client et retourné également à Big Science et à
l'Université de Washington pour analyse ultérieure (voir ci-dessous).
Du côté du serveur, une ligne T1 peut transmettre 90 Go par semaine et donc 360 clients pourrait être servis chaque semaine (ou 180 000
deux fois par semaine) avec une seule liaison sortante. Ces 90 Go représentent 30 % d'une semaine complète d'enregistrement à Arecibo, ou
43 % d'une semaine plus réaliste (avec une efficacité de 70 %).
L'analyse des signaux chez soi (@home).
Le caractère unique et l'avantage de SETI@home d'un point de vue SETI est la profondeur de l'analyse de signal qui sera possible par chaque tronçon de
bande passante et de temps (position dans le ciel.) (N.B. : Les clients n'auront aucun contrôle sur la nature de la recherche les cycles processeur
de l'ordinateur domestique sont simplement empruntés par un programme automatique.)
On propose de rechercher des signaux de largeur allant de 0,1 Hz (une F.F.T. à 2 x 105 points) à 2 000 Hz. (SERENDIP recherche
actuellement des lignes de largeur 0,6 à 640 Hz ; la redondance partielle entre les deux recherches fournira une inter-vérification utile.) Tous
les signaux seront cherchés pour chacune des 40 vitesses distinctes de dérive Doppler (durant les 12 secondes de traversée d'un faisceau) ; tout ce qui
a une dérive nulle en accord avec le cadre de référence de Puerto Rico sera automatiquement rejeté en tant que I.R.F., mais toutes les dérives non nulles
seront retenues, particulièrement celles correspondant à l'accélération rotationelle et orbitale de la Terre (de l'ordre de 0,5 à 1,5 Hz sur 12
secondes ; la valeur réelle au moment de l'observation sera calculée par le serveur et inscrite dans le tronçon de données.)
Les données permettent également la recherche des signaux intermittents ou pulsatifs avec des durées de 0,5 ms à 10 s - c'est un des avantages
principaux de SETI@home sur SERENDIP, qui ne peut détecter des impulsions espacées de plus de 1,7 s. Tout signal qui dure moins qu'une largeur de
faisceau pourrait être une I.R.F. parasite, mais il sera conservé (au moins avec un poids plus faible). Les candidats les plus viables doivent néanmoins
s'accorder à la forme du faisceau, c'est le meilleur critère pour distinguer une source ponctuelle réelle d'une I.R.F. Aussi un filtre de corrélation
Gaussien au faisceau (avec une largeur de 12 secondes) sera aussi appliqué à tous les signaux candidats. En résumé, les signaux candidats seront rapportés
au serveur sur la base de leur rapport signal/bruit affiché pour les meilleurs largeur de bande, longueur de temps, canal de fréquence et accord à la forme
du faisceau.
Le post-traitement.
Le post-traitement à l'Université de Washington construira une base de données de tous les signaux candidats rapportés par les ordinateurs clients.
Cette base de données sera utilisée pour consulter la progression de l'étude, la qualité des données, et l'environnement I.R.F. d'Arecibo, et décider si
des changements sont souhaitables dans l'étude ou les procédures opérationnelles.
Avec le nombre extrêmement élevé de cas que nous examinerons, nous nous attendons à ce que des I.R.F. se comportent, par chance, d'une telle manière
qu'ils imitent un signal extraterrestre. Aussi il est très important que tous les candidats de rapport signal/bruit élevé observés une fois ne soient
considéré comme de sérieux candidats qu'après une confirmation positive par d'autres passages (aléatoires) du faisceau (normalement 3 à 6 mois plus tard)
sur le même secteur de ciel. Le traitement final surveillera ces passages suivants et comparera la consistance des caractéristiques des signaux candidats
pour chaque passage. De cette façon un ensemble des meilleurs candidats sera accumulé, à vérifier plus tard avec un temps dédié d'observation à Arecibo.
Ce post-traitement recherchera également des régularités caractéristiques des signaux rapportés en tant que membres d'un même groupe. Un exemple en
est les multiplets de fréquences, nommément des paires de n-uplets de signaux étroits arbitraires, mais espacés de façon égale. Pour les avantages de ces
signaux dans la recherche SETI, voyez [ Cohen ] (1994) et [ Cordes et Sullivan ] (1994).
On ne doit pas oublier qu'il existe finalement la possibilité très tentante de découvrir au travers du SERENDIP, en tant que sous-produit de cette
analyse SETI, un tout nouveau type de phénomène astrophysique se produisant naturellement. L'analyse globale de recherche est la même excepté que les
signaux naturels pourraient être bien plus diffus qu'un simple faisceau, et par conséquent bien plus difficiles à distinguer des I.R.F. Pour des candidats
plus petits que le faisceau, cependant, la distinction entre une origine naturelle ou intelligente ne pourra venir que plus tard après observations et analyse
conséquente.
L'écran de veille lui-même.
Le programme que tourne sur chaque ordinateur client ressemble et se comporte comme un écran de veille captivant. Il ne fonctionne que quand la machine est
inactive, et l'utilisateur peut choisir entre plusieurs "visualisations" différentes du processus SETI, colorées et animées. Certaines de ces
visualisations paraîtront techniques, d'autres paraîtront abstraites, et certaines pourrait décidément ressembler à de l'art. Nous fournirons un ensemble
de base de visualisations, en même temps qu'un mécanisme de "plug-in" de manière à pouvoir en ajouter d'autres facilement.
Les modes standards de l'écran de veille pourraient inclure (1) une carte du monde montrant la localisation de toutes les machines participant au projet,
(2) une carte du ciel montrant quels secteurs ont été couverts par l'étude et la localisation du secteur de ciel en cours d'analyse (avec l'option
d'afficher les figures mythologiques classiques pour les constellations - on pourrait voir, par exemple, que le secteur de quelqu'un est dans l'aisselle
d'Orion !), (3) des motifs colorés et changeant qui correspondent aux transformées de Fourier actuellement menées, et (4) des graphiques
"plats" montrant les résultats de l'analyse de données évoluant actuellement.
Conclusion.
En ce septembre 1996, SETI@home n'est encore qu'une proposition, mais nous nous sentons certains que cela se produira rapidement. Les clients potentiels
pour SETI@home incluent les enthousiastes d'astronomie et d'espace (par exemple les membres de la Planetary Society), les fans de science-fiction (p. ex. les
"Trekkies"), les aventuriers d'Internet (les "têtes branchées"), les professeurs de science et leurs étudiants, et tous les
enthousiastes de sciences & technologies. Tout ce dont nous avons besoin pour faire de ce projet communautaire global une réalité est le partenariat
d'une compagnie de haute technologie visionnaire. Le projet est de la bonne science et il générera une publicité attirante et bienfaitrice pour tout
partenaire, de même que pour la science en général et la bio-astronomie en particulier. Il y a preneurs ?
RÉFÉRENCES.
- [ Bowyer S., Werthimer D., Cobb J., et Lampton M. ] (1997) :
"Twenty years of SERENDIP, the Berkeley SETI effort : past results and future plans" (Vingt ans du projet SERENDIP, l'effort
SETI de Berkeley : résultats passés et plans futurs), ce volume.
- [ Cohen N., et Charlton D. ] (1995) :
"Polychromatic SETI" (SETI polychrome), pp. 313-22 dans "Progress in the search for extraterrestrial life"
(Des progrès dans la Recherche de la Vie Extraterrestre),
éd. G.S. Shostak (San Francisco : Astronomical Soc. of the Pacific).
- [ Cordes J., et Sullivan W.T. III ] (1995) :
"Astrophysical coding" (Encodage astrophysique), pp. 325-42 dans "Progress in the search for extraterrestrial
life" (Des progrès dans la Recherche de la Vie Extraterrestre),
éd. G.S. Shostak (San Francisco : Astronomical Soc. of the Pacific).
- [ Sullivan W.T. III, et Mighell K.M. ] (1984) :
"A Milky Way search strategy for extraterrestrial intelligence" (Une stratégie de recherche dans la Voie Lactée pour
l'intelligence extraterrestre),
Icarus numéro 60, pp. 675-84.
Des questions ? Écrivez-nous !
Retour au sommaire de SETI@home.
|