Rapport du Stress Test du décembre 2019
9 décembre 2019 à 11h32
Source : Stress Test Review
Que s'est-il passé lors du premier Stress Test ouvert "explosif" de Fractured? Découvrons-le! ( les serveurs ont explosé)*
Salut, camarade de jeu et passionné de MMO!
Notre week-end de Stress Test est terminé, et ça a été un grand… bordel! Pas rare pour un test de stress, mais peut-être légèrement pire que prévu
Lorsque nous l'avons annoncé, nous nous sommes posé les questions suivantes:
- Client patcher - le téléchargement sera-t-il aussi rapide que maintenant?
- Serveur de connexion - y aura-t-il des files d'attente?
- Workers de serveurs - les processus qui simulent le côté serveur mondial pourront-ils gérer un grand nombre d'utilisateurs simultanés?
- Monde du jeu - la carte sera-t-elle trop occupée ou deviendra-t-il trop difficile de trouver un terrain libre?
Je peux dire que nous avons la réponse à toutes sauf la dernière, alors allons-y!
The Good (Le Bon)
Les Workers étaient stables
Les Workers sont les processus Unity qui s'occupent de simuler le monde sur le serveur. Chaque Workers contrôle une partie de notre monde ouvert, et les joueurs ne perçoivent rien lorsqu'ils passent de l'un à l'autre grâce à la magie de SpatialOS qui les assemble.
Pendant le Stress Test, les Workers n'ont montrés aucun signe de surcharge. Tant ceux qui contrôlaient les zones qui comprenaient de nouveaux points d'apparition de joueurs que ceux qui contrôlaient les points chauds où une action PvE intense se déroulait se déroulaient sans problème. C'est une excellente nouvelle pour nous en termes de gameplay car cela montre que nous pouvons déjà gérer de grandes batailles PvE / PvP, mais aussi financièrement, car cela signifie que nous avons besoin de serveurs moins puissants.
L'intérêt était élevé.
L'Open Test Weekend a révélé un intérêt pour Fractured qui nous a surpris - et a grandement contribué à la disparition du serveur
Plus de 4 000 nouveaux comptes ont été créés depuis le jour de l'annonce du test (mercredi) jusqu'à sa clôture (samedi). Près de 13 000 Personnages ont été créés pendant le test (appartenant à environ 9 000 comptes distincts).
Au moment même où nous ouvrions les serveurs après un correctif, des dizaines d'utilisateurs tentaient de se connecter en même temps (serveur de connexion RIP). C'était excitant à regarder et nous attendons avec impatience ce qui se passera lors de notre prochain Stress Test!
Le mauvais
Server-killing issue (Problème de blocage du serveur)
C'est quelque chose que nous avons commencé à expérimenter peu de temps après l'ouverture vendredi et rendu immédiatement public sur nos forums. Une fois que quelques centaines d'utilisateurs simultanés sont connectés et jouent activement, quelque chose se déchaîne (<= devient très technique) dans un composant de notre moteur backend (SpatialOS). Ce composant est appelé «runtime» et est chargé de gérer les données persistantes et la communication entre les Workers (clients et serveurs).
Au cours du week-end, nous avons essayé de résoudre le problème en travaillant sur quelques solutions possibles. Nous avons déposé un patch rapide vendredi soir, un autre en profondeur vendredi soir, puis finalement samedi après-midi. Étant donné que le problème était interne au moteur, nous étions dans le noir total - et devinez quoi? Aucune de nos tentatives n'a réussi. Il était clair que nous devions attendre le soutien des ingénieurs de SpatialOS lundi pour le comprendre.
Samedi soir, nous avons eu un choix: laisser le test de stress en cours avec un nombre fortement limité d'utilisateurs simultanés et de files d'attente sans fin pour se connecter, ou y mettre fin tôt et exécuter un nouveau test de stress dans un avenir (proche). Nous avons choisi ce dernier.
Infrastructure Web inadéquate
À ce jour, notre serveur de connexion et notre API Web sont les composants les plus «alpha» de Fractured. Ils sont déployés sur une machine très faible et manquent de fonctionnalités de base telles que les files d'attente de connexion.
Nous ne pensions pas que le test de résistance mettrait autant de pression sur notre infrastructure Web, mais c'est arrivé et c'était inévitable. Aux heures de pointe, il faudrait un certain temps pour pouvoir se connecter et accéder à la sélection des personnages. Le plafond d'utilisateurs simultanés que nous avons dû mettre en place en raison du problème décrit ci-dessus a aggravé les choses, augmentant le nombre de joueurs entre les mains du serveur de connexion.
La bonne nouvelle ici est que nous devons simplement déplacer ces services vers un hôte évolutif approprié et les étendre un peu - un travail relativement rapide que nous aurons accompli avant le prochain Stress Test.
Et après?
Un nouveau Stress Test ouvert à tous les utilisateurs enregistrés! Celui-ci Commencera peut-être au début de la semaine, lorsque nous pourrons immédiatement travailler avec les ingénieurs de SpatialOS en cas de problème.
Avant cela, nous envisageons également d'exécuter un test de résistance ouvert à tous les backers - ce qui signifie notamment les promesses de dons Beta2 / Beta1, mais pas les comptes gratuits. Le nombre d'utilisateurs simultanés au cours d'un tel test serait beaucoup plus petit, mais, espérons-le, assez pour révéler si le problème est résolu avant de passer au test à grande échelle.
Il est impossible de dire quand ce dernier aura lieu - nous aimerions le lancer avant Noël, car nous savons que beaucoup d'entre vous sont impatients de tester d'avantage le jeu et certains n'ont pas réussi à se connecter du tout. Cependant, nous ne pouvons faire aucune prédiction significative sur le temps qu'il faudra pour que le bogue soit réglé. Si ce n'est pas décembre, ce sera janvier, alors restez à l'écoute et…
… Croisez les doigts !