Cómo validar una etiqueta HTML usando expresiones regulares

Dada la string str , la tarea es verificar si es una etiqueta HTML válida o no mediante el uso de expresiones regulares .
La etiqueta HTML válida debe cumplir las siguientes condiciones: 

  1. Debe comenzar con una etiqueta de apertura (<).
  2. Debe ir seguido de una string de comillas dobles o de comillas simples.
  3. No debe permitir una string de comillas dobles, una string de comillas simples o una etiqueta de cierre (>) sin comillas simples o dobles.
  4. Debe terminar con una etiqueta de cierre (>).

Ejemplos: 

Entrada: str = “<valor de entrada = ‘>’>”; 
Salida: verdadero 
Explicación: La string dada satisface todas las condiciones mencionadas anteriormente.
Entrada: string = “<br/>”; 
Salida: verdadero 
Explicación: La string dada satisface todas las condiciones mencionadas anteriormente.
Entrada: str = “br/>”; 
Salida: falso 
Explicación: la string dada no comienza con una etiqueta de apertura «<«. Por lo tanto, no es una etiqueta HTML válida.
Entrada: str = “<‘br/>”; 
Salida: falso 
Explicación: la string dada tiene una string de comillas simples que no está permitida. Por lo tanto, no es una etiqueta HTML válida.
Entrada: str = “<valor de entrada => >”; 
Salida: falso 
Explicación: la string dada tiene una etiqueta de cierre (>) sin comillas simples o dobles encerradas que no está permitida. Por lo tanto, no es una etiqueta HTML válida.

Enfoque: La idea es usar la expresión regular para resolver este problema. Se pueden seguir los siguientes pasos para calcular la respuesta. 

  • Consigue la cuerda.
  • Cree una expresión regular para verificar la etiqueta HTML válida como se menciona a continuación: 
     

expresión regular = “<(“[^”]*”|'[^’]*’|[^’”>])*>”; 

  • Dónde: 
    • < representa que la string debe comenzar con una etiqueta de apertura (<).
    • ( representa el comienzo del grupo.
    • “[^”]*” representa la string que debe permitir la string entre comillas dobles.
    • | representa o.
    • ‘[^’]* ‘ representa la string que debe permitir strings entre comillas simples.
    • | representa o.
    • [^’”>] representa que la string no debe contener comillas simples, comillas dobles ni “>”.
    • ) representa el final del grupo.
    • * representa 0 o más.
    • > representa que la string debe terminar con una etiqueta de cierre (>).
  • Haga coincidir la string dada con la expresión regular. En Java, esto se puede hacer usando Pattern.matcher() .
  • Devuelve verdadero si la string coincide con la expresión regular dada; de lo contrario, devuelve falso.

A continuación se muestra la implementación del enfoque anterior: 
 

C++

// C++ program to validate the
// HTML tag using Regular Expression
#include <iostream>
#include <regex>
using namespace std;
 
// Function to validate the HTML tag.
bool isValidHTMLTag(string str)
{
 
  // Regex to check valid HTML tag.
  const regex pattern("<(\"[^\"]*\"|'[^']*'|[^'\">])*>");
 
  // If the HTML tag
  // is empty return false
  if (str.empty())
  {
     return false;
  }
 
  // Return true if the HTML tag
  // matched the ReGex
  if(regex_match(str, pattern))
  {
    return true;
  }
  else
  {
    return false;
  }
}
 
// Driver Code
int main()
{
   
  // Test Case 1:
  string str1 = "<input value = '>'>";
  cout << isValidHTMLTag(str1) << endl;
 
  // Test Case 2:
  string str2 = "<br/>";
  cout << isValidHTMLTag(str2) << endl;
 
  // Test Case 3:
  string str3 = "br/>";
  cout << isValidHTMLTag(str3) << endl;
 
  // Test Case 4:
  string str4 = "<'br/>";
  cout << isValidHTMLTag(str4) << endl;
 
  // Test Case 5:
  string str5 = "<input value => >";
  cout << isValidHTMLTag(str5) << endl;
 
  return 0;
}
 
// This code is contributed by yuvraj_chandra

Java

// Java program to validate
// HTML tag using regex.
 
import java.util.regex.*;
 
class GFG {
 
    // Function to validate
    // HTML tag using regex.
    public static boolean
    isValidHTMLTag(String str)
    {
        // Regex to check valid HTML tag.
        String regex
            = "<(\"[^\"]*\"|'[^']*'|[^'\">])*>";
 
        // Compile the ReGex
        Pattern p = Pattern.compile(regex);
 
        // If the string is empty
        // return false
        if (str == null) {
            return false;
        }
 
        // Find match between given string
        // and regular expression
        // using Pattern.matcher()
        Matcher m = p.matcher(str);
 
        // Return if the string
        // matched the ReGex
        return m.matches();
    }
 
    // Driver Code.
    public static void main(String args[])
    {
 
        // Test Case 1:
        String str1 = "<input value = '>'>";
        System.out.println(isValidHTMLTag(str1));
 
        // Test Case 2:
        String str2 = "<br/>";
        System.out.println(isValidHTMLTag(str2));
 
        // Test Case 3:
        String str3 = "br/>";
        System.out.println(isValidHTMLTag(str3));
 
        // Test Case 4:
        String str4 = "<'br/>";
        System.out.println(isValidHTMLTag(str4));
 
        // Test Case 5:
        String str5 = "<input value => >";
        System.out.println(isValidHTMLTag(str5));
    }
}

Python3

# Python3 program to validate
# HTML tag using regex.  
# using regular expression
import re
 
# Function to validate
# HTML tag using regex.
def isValidHTMLTag(str):
 
    # Regex to check valid
    # HTML tag using regex.
    regex = "<(\"[^\"]*\"|'[^']*'|[^'\">])*>"
     
    # Compile the ReGex
    p = re.compile(regex)
 
    # If the string is empty
    # return false
    if (str == None):
        return False
 
    # Return if the string
    # matched the ReGex
    if(re.search(p, str)):
        return True
    else:
        return False
 
# Driver code
 
# Test Case 1:
str1 = "<input value = '>'>"
print(isValidHTMLTag(str1))
 
# Test Case 2:
str2 = "<br/>"
print(isValidHTMLTag(str2))
 
# Test Case 3:
str3 = "br/>"
print(isValidHTMLTag(str3))
 
# Test Case 4:
str4 = "<'br/>"
print(isValidHTMLTag(str4))
 
# This code is contributed by avanitrachhadiya2155
Producción: 

true
true
false
false
false

 

Publicación traducida automáticamente

Artículo escrito por prashant_srivastava y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *