Mis à jour
Fermé | 14.01.2021 | 11:43 GMT+01:00
Rapport d'incident
DATE :
Début de l’incident :14/01/2021 11h30
Clôture de l’incident : 14/01/2021 11h43
IMPACT
- Service impacté:
Application LUMA / Visualisation des données dans le BO
- Impact Client:
Impossibilité de visualiser les données de l'application LUMA dans le portail et d'utiliser les fonctions de l'application LUMA depuis le portail
CAUSE :
Problème accès à la base de donnée
STATUT DES SERVICES
Nominal
INCIDENT
Terminé
Ouvert | 14.01.2021 | 11:37 GMT+01:00
Nous rencontrons actuellement un dysfonctionnement sur l'application LUMA
La résolution est en cours
--
We are currently experiencing a incident on application LUMA. We make every effort to diagnose and solve this issue as soon as possible
Fermé | 20.11.2020 | 11:00 GMT+01:00
REMARQUE Ce rapport ne concerne que le service de paiement E-commerce et non IP ou GPRS qui a fait l'objet d'un autre Rapport
Veuillez trouver ci joint le rapport d'incident du 19/11/2020 concernant les services de paiement E-commerce
------------------------------------------------------------------
Rapport d’incident
------------------------------------------------------------------
--- Date ---
Début de l’incident :9h18 19/11/2020
Clôture de l’incident : 9h00 20/11/2020
--- Impact ---
Service impacté
· Service de paiement ( Back Office – Service de Paiement )
Horodatage
· 9h18 19/11/2020 : lenteurs d’accès au service
· 9h30 19/11/2020 – 10h15 19/11/2020 : Indisponibilité totale d’un site de production 9h30 - 50 % du trafic traité
· 10h15 19/11/2020 – Service Nominal
· 10h40 19/11/2020 – 10h45 19/11/2020 coupure totale des deux sites
· 10h45 19/11/2020 – reprise du trafic 50% à 80% Service du flux traité
· 10h57 19/11/2020 – Service Nominal
· 15h09 19/11/2020 – 15h24 19/11/2020 Service perturbé - 50 % du trafic traité
· 15h24 19/11/2020 – Service Nominal
--- Cause ---
Défaillance matérielle sur le Firewall ayant entrainée une défaillance d’un site de production.
Cette défaillance a engendré des perturbations en chaîne :
Engorgement du système de log suivi d’une diminution du traitement des entrées IP SSL allant jusqu’à la saturation et donc l’indisponibilité du service.
--- Actions pendant l’incident ---
· 10h15 19/11/2020 – bascule de l’ensemble des flux sur le deuxième site de production
· 10h40 19/11/2020 – Remise en service du site impacté par l’incident
· 10h40 19/11/2020 – Trafic remis en équilibrage sur les deux sites de production
· 15h24 19/11/2020 – Remise en service du site impacté par l’incident
--- Plan d’actions ---
Objectif : Réduire les risques d’un nouvel incident induit par le système de centralisation des log
· Analyse du système de centralisation des log.
· Définition d’un nouveau schéma de centralisation des log.
--- Statut des services ---
Services Opérationnels
--- Incident ---
Clos avec actions de fond pour que l’incident ne se reproduise pas
Sous surveillance | 19.11.2020 | 15:44 GMT+01:00
Début 9h30 19/11/2020
Service Up 10h15
Nouvelle perturbation 15h15 - Fin perturbation 15h40
Fin:
Impact :
Perturbation de l’ensemble des services de paiement ( Paiement en ligne / Back office marchant / Back Office Acquéreur)
Cause :
défaillance d’un site de production ( Site de Toulouse ) – En cours d’analyse
Actions finalisée
Bascule de l’ensemble des flux sur le site de production de Bordeaux ( 10h15 )
Remise en service du site de TOULOUSE (10h57 )
Statut des services
Service nominal
Ouvert | 19.11.2020 | 15:29 GMT+01:00
Date :
Début 9h30 19/11/2020
Service Up 10h15
Nouvelle perturbation 15h15
Fin:
Impact :
Perturbation de l’ensemble des services de paiement ( Paiement en ligne / Back office marchant / Back Office Acquéreur)
Cause :
défaillance d’un site de production ( Site de Toulouse ) – En cours d’analyse
Actions finalisée
Bascule de l’ensemble des flux sur le site de production de Bordeaux ( 10h15 )
Remise en service du site de TOULOUSE (10h57 )
Statut des services
Perturbation majeure
Sous surveillance | 19.11.2020 | 10:57 GMT+01:00
Date :
Début 9h30 19/11/2020
Fin :
L'ensemble des services est désormais en mode nominal. ( Surveillance en cours )
Le rapport est en cours de rédaction.
Fermé | 20.11.2020 | 10:27 GMT+01:00
Veuillez trouver ci dessous le rapport d'incident du 19/11/2020
------------------------------------------------------------------
Rapport d’incident
------------------------------------------------------------------
--- Date ---
• Début de l’incident :9h18 19/11/2020
• Clôture de l’incident : 9h00 20/11/2020
--- Impact ---
Services impactés
• Service GPRS ( Autorisation / Télécollecte )
• Service IP ( Autorisation / Télécollecte )
• Service LUMA ( Accès portail )
• Portail monétique
Horodatage
• 9h18 19/11/2020 – 10h15 19/11/2020 : Indisponibilité totale d’un site de production 9h30 – site secondaire avec des performances dégradées.
• 10h15 19/11/2020 – 10h59 19/11/2020 : Indisponibilité totale d’un site de production 9h30 – site secondaire avec des performances très fortement dégradées. ( 80% des flux )
• 10h59 19/11/2020 – 15h09 19/11/2020 : service nominal
• 15h09 19/11/2020 – 15h24 19/11/2020 coupures partielles sur un site de production
• 15h24 – Service nominal
--- Cause ---
Défaillance Matérielle sur le Firewall ayant entrainé une défaillance d’un site de production.
Cette défaillance a engendré des perturbations en chaîne :
Engorgement du système de log suivi d’une diminution du traitement des entrées IP SSL allant jusqu’à la saturation et donc l’indisponibilité du service.
--- Plan d’actions ---
Objectif : Réduire les risques d’un nouvel incident induit par le système de centralisation des log
• Analyse du système de centralisation des log.
• Définition d’un nouveau schéma de centralisation des log.
--- Statut des services ---
Services Opérationnels
---Incident ---
Clos avec action de fond
Sous surveillance | 19.11.2020 | 15:49 GMT+01:00
Début
15h08 19/11/2020
Service Up : 15h25
Impact :
Perturbation de l’ensemble des services de paiement (Autorisation / Télécollecte / Accès au portail monétique )
Cause :
défaillance d’un site de production ( Site de Toulouse ) – En cours d’analyse
Statut des services
Service nominal
Résolu | 10.11.2020 | 12:03 GMT+01:00
Nous avons rencontré un incident sur le service Autorisation - Télécollecte.
Rapport d'incident
Date
- 10/11/2020 00h20 - 00h30
- 10/11/2020 01h20 - 01h30
- 10/11/2020 7h05 - 7h15
- 10/11/2020 10h24 - 10h39
Impact
Certains appels entrants sur notre passerelle ont échoué durant les périodes définies sur notre infrastructure à Toulouse.
Notre deuxième site n'a pas été impacté.
Échec autorisation / Échec télécollecte
Cause
Problème dans le système d'écriture des log ayant saturé le pool de sockets entrant
Action
Modification de la configuration du système d'écriture des log.
------------------------------------------------------------------------
REPORT OF INCIDENT
we are facing an incident on the service "authorization and capture"
Date
- 2020/10/11/ 00:20 - 00:30
- 2020/10/11/ 01:20 - 01:30
- 2020/10/11/ 7:05 - 7:15
- 2020/10/11/ 10:30 - 10:40
Impact
Some calls failed on the period above. ( Authorization and Capture )
Only one site impacted
Root cause
Problem of the process of writing log with a traffic congestion about the sockets IP incoming
Action
Improvement of system of log ( change settings )
Status
Monotoring
Fermé | 29.10.2020 | 00:00 GMT+01:00
La hotix corrigeant le problème a été livrée.
---------------
The hotifx has been delivered, the problem is solved.
Ouvert | 23.10.2020 | 16:03 GMT+02:00
Nous rencontrons actuellement une anomalie sur la gestion des transactions.
Impact
- Toute transaction ayant le statut en attente d'autorisation n'est pas modifiable.
Action
- Hotfix livraison le 27/10/2020
-----------------------------------------------------------------------------------------------------------------------
We are facing of minor pertubation about the transaction's management.
Impact
The feature "modification of transaction" doesn't work anymore.
Action:
hotfix : delivery on 2020/10/27
Fermé | 25.10.2020 | 15:30 GMT+01:00
Nous avons rencontré des problèmes sur certains de nos services IP et GPRS sur un de nos datacenters entre 14h et 15h20 le 25/10/2020, notre deuxième datacenter est resté actif durant toute cette période.
--
We have experienced an issue which is affecting our IP and GPRS services on one of our datacenters between 2pm and 3pm20 (Paris time) , difficulties of access or connection was possible. Our second datacenter access was totally active during this downtime.
Fermé | 01.10.2020 | 09:38 GMT+02:00
Incident clos
Sous surveillance | 25.09.2020 | 17:24 GMT+02:00
Incident résolu
Surveillance en cours
Début 25.09.2020 16h50
Fin 25.09.2020 17h20
---------------------------------------------------
Incident closed
monitoring is in progress
Start time 2020.09.25 4:50PM
End 2020.09.25 5:20PM
Ouvert | 25.09.2020 | 17:09 GMT+02:00
Nous constatons actuellement une dégradation sur notre service LUMA, L’investigation est en cours.
--
We are currently seeing a deterioration on our service LUMA, Investigation is in progress
Fermé | 24.09.2020 | 11:41 GMT+02:00
Suite à l'intervention de Bouygues nous observons un retour à la normale depuis hier matin.
Rapport incident:
Date 17.09.2020 - 11h15
Résolu 23.09.2020 - 1h
Clos 24.09.2020 - 11h40
Impact
Défaut de connexion sur le réseau 3G ( moins de 1% du trafic )
Localité : Paris et Ile de France
Cause
Défaut sur un des contrôleurs radio 3G couvrant Paris .
Action
Intervention de Bouygues Télécom le 23.09.2020 à 1h
Résolution en cours | 22.09.2020 | 17:34 GMT+02:00
Bouygues Télécom a identifié un défaut sur un de ses contrôleurs radio 3G couvrant Paris, qui est dû à une bascule de flux dans la matinée du 17/09.
La cause de cette bascule est toujours inconnue. Pour corriger le défaut Bouygues Télécom doit refaire la bascule ce qui engendre un fort risque en HO .
Bouygues a planifié une bascule cette nuit à 1H afin de résoudre la problématique
En attente | 18.09.2020 | 17:21 GMT+02:00
Notre analyse montre que:
L'incident est très localisé sur la région Ile de France et Paris.
Les SIM impactées sont attached au réseau Bouygues
Le trafic est très faiblement impacté moins de 1% du trafic
Solution de contournement : Sélectionner un autre opérateur quand cela est possible depuis l'application optinet
Le problème a été escaladé chez l'opérateur Bouygues
Ouvert | 18.09.2020 | 11:46 GMT+02:00
Nous rencontrons actuellement des perturbations sur certains de nos services :
Connexion GPRS - 3G .
Nous mettons tout en œuvre pour diagnostiquer et résoudre le problème au plus vite.
--
We are currently experiencing incidents on some of services:
Connection GPRS -3G
We make every effort to diagnose and solve this issue as soon as possible
Fermé | 02.09.2020 | 09:38 GMT+02:00
Incident Clos
Résolu | 30.08.2020 | 21:02 GMT+02:00
Le problème a été résolu par l'opérateur CenturyLink/Level3 à 16h20 (Heure Paris). Tous les appels Internet traversant cet opérateur de peering international de niveau 1 sont de nouveau fonctionnel. Vous trouverez leur communication ici : https://twitter.com/CenturyLinkHelp
Services impactés de 12h15 à 16h20 (heure de Paris) :
- Cette panne a impacté particulièrement l'accès aux IPN (URL de serveur à serveur), les paiement 3DSecure et les paiements PayPal, les ordres de paiement WhatsAPP.
- Pour les clients ayant reçu des échecs d'exécution de leusr IPN (URL serveur à serveur), nous vous conseillons de vérifier leur statut sur le backoffice Marchand et d'opérer un rejeu en cas de besoin.
- Cette panne a pu provoquer des impossibilités d'accès à nos services en IP si votre client utilise un opérateur international pour sa connexion Internet.
----------------------------------
The problem was resolved by the CenturyLink / Level3 operator at 4:20 p.m. (Paris time). Internet traffic through this international level 1 peering operator is functional again. You will find its communication here: https://twitter.com/CenturyLinkHelp
Service impacted from 12:15 to 4:20pm :
- This outage particularly impacted access to IPNs (server-to-server URLs), 3DSecure payments and PayPal payments.
- For customers who have received IPN (server-to-server URL) execution failures, we advise you to check their status on the Merchant backoffice and to replay them if necessary.
- This failure could have been impacted the access to our IP services if your customer uses an international operator for his Internet connection.
Résolution en cours | 30.08.2020 | 16:25 GMT+02:00
L'opérateur de peering International CenturyLink/Level3 a subi entre 12h15 et 16h20 (Heure de Paris) une panne impactant de façon globale le trafic internet mondial.
Cette panne a impacté particulièrement l'accès aux IPN (URL de serveur à serveur), les paiement 3DSecure et les paiements PayPal, les ordres de paiement WhatsAPP.
Pour les clients ayant reçu des échecs d'exécution de leusr IPN (URL serveur à serveur), nous vous conseillons de vérifier leur statut sur le backoffice Marchand et d'opérer un rejeu en cas de besoin.
Cette panne a pu provoquer des impossibilités d'accès à nos services en IP si votre client utilise un opérateur international pour sa connexion Internet.
--------------------------------
The International Peering operator CenturyLink / Level3 suffered between 12:15 and 4:20 p.m. (Paris time) a failure that had a global impact on global internet traffic.
This outage particularly impacted access to IPNs (server-to-server URLs), 3DSecure payments and PayPal payments.
For customers who have received IPN (server-to-server URL) execution failures, we advise you to check their status on the Merchant backoffice and to replay them if necessary.
This failure could have been impacted the access to our IP services if your customer uses an international operator for his Internet connection.
Ouvert | 30.08.2020 | 12:15 GMT+02:00
Nous rencontrons actuellement des perturbations mineures sur l’ensemble de nos services. Nous mettons tout en œuvre pour diagnostiquer et résoudre le problème au plus vite.
--
We are currently experiencing a minor incident on all of our services. We make every effort to diagnose and solve this issue as soon as possible
Fermé | 06.05.2020 | 20:15 GMT+02:00
SFR a rencontré un incident générique sur les APN dédiés pour l'ensemble des clients Entreprises du 06/05/2020 à 00h30 au 06/05/2020 à 20h15.
Résolution de l'incident à 20h15 suite correction sur un de nos équipements cœur de réseau IP.
Si vous rencontrez toujours des dysfonctionnements résiduels, merci de contacter notre support
Nous nous excusons pour la gêne occasionnée.
Fin de la Communication Gestion de Crise.
Ouvert | 06.05.2020 | 10:00 GMT+02:00
Incident GPRS sur réseau SFR
Début de l’incident : 06 Mai
Type de Sim : « Mono opérateur sur réseau 2G /3G / 4G »
Impact : SIM uniquement avec l'APN Privé
Secteur impacté : France
Incident : Problème de transmission data
Actions en cours : Les équipes de SFR sont mobilisées afin de résoudre cet incident.
Solution : Les cartes Sim-Multi opérateur avec Optinet vous permet de modifier l'opérateur utilisé par le terminal.
Cette fonctionnalité est particulièrement adaptée à ce type de situation.
Nous sommes en relation avec les experts de SFR afin de rétablir le service au plus vite.
La référence ticket associé à cette intervention est le N°ticket : Ref#20216806.
Fermé | 24.01.2020 | 08:00 GMT+01:00
Incident Attaque DDOS
----------------------------------------------------
Incident Clos
Incident Attack DDOS
----------------------------------------------------
Incident Closed
Résolu | 23.01.2020 | 10:22 GMT+01:00
Incident Attaque DDOS
----------------------------------------------------
Nous observons une très forte augmentation du trafic suite à 2 attaques de type DDOS
9h30 -9h35 : attaque DDOS.
10h - 10h20 : attaque DDOS.
L'ensemble de nos solutions Anti DDOS ont réagi de manière nominale.
------------------------
IMPACT
------------------------
Quelques ralentissements sur le service de paiement et sur service back office.
Incident Attack DDOS
----------------------------------------------------
We was facing of strong increase flow associated to 2 attacks DDOS
9h30 -9h35 : attack DDOS
10h - 10h20 : attack DDOS.
The solutions of security worked well.
------------------------
IMPACT
------------------------
Some slowdowns on the payment service and on the Back office service.
The monitoring is still in progress
Ouvert | 23.01.2020 | 09:34 GMT+01:00
Nous rencontrons actuellement des perturbations importantes sur l’ensemble de nos services. Nous mettons tout en œuvre pour diagnostiquer et résoudre le problème au plus vite.
--
We are currently experiencing an outage on all of our services. We make every effort to diagnose and solve this issue as soon as possible