Calcule las cargas del servidor mediante la programación por turnos

Dados M servidores que manejan múltiples requests con una capacidad computacional infinita y arreglos de tiempo de llegada [] y tiempo de proceso [] de tamaño N que denotan el tiempo de llegada y el tiempo de carga de N requests de la siguiente manera:

Cada servidor está numerado de 0 a (M – 1) y las requests se dan en orden de tiempo estrictamente creciente.
Cada solicitud i se asigna a uno de los servidores de la siguiente manera:
- Elija el (i % m) ^servidor . Si el servidor elegido está libre, asigne la solicitud al servidor.
- De lo contrario, elija el siguiente servidor disponible. Si no hay ningún servidor disponible, se descarta la solicitud.

Teniendo en cuenta que cada servidor puede manejar solo una solicitud a la vez, la tarea es encontrar la carga en cada servidor después de que se procesen todas las requests entrantes dado que la carga en cada servidor es la cantidad de requests que procesa.

Ejemplos:

Entrada : N = 4, M = 3, tiempo de llegada [] = {1, 3, 6, 8}, tiempo de proceso [] = {1, 2, 2, 1} Salida
: 1er ^servidor -> 2 2do ^servidor -> 1 3er ^Servidor -> 1 Explicación: La primera y la cuarta solicitud se asignan al primer servidor. La segunda solicitud se asigna al segundo servidor y la tercera solicitud se asigna al tercer servidor. A continuación se muestra la tabla de transición:

número de solicitud Hora de llegada Tiempo de carga Hora de finalización Servidores disponibles Servidor demandado Servidor asignado

0 1 1 2 0, 1, 2 0 0

1 3 2 5 0, 1, 2 1 1

2 6 2 8 0, 1, 2 2 2

3 8 1 9 0, 1, 2 1 1

Entrada : N = 4, M = 2, tiempo de llegada = {1, 2, 4, 6}, tiempo de proceso = {7, 1, 4, 4}
Salida :
1er servidor -> 1
2do servidor -> 2
Explicación:
la primera solicitud se asigna al primer servidor y la segunda solicitud al segundo servidor.
La tercera solicitud se asigna al segundo servidor. El servidor solicitado para la tercera solicitud es el primer servidor, pero como está ocupado en el momento de la llegada de la solicitud,
se le asigna el segundo servidor.
La cuarta solicitud se descarta porque ambos servidores están ocupados en el momento de su llegada.
A continuación se muestra la tabla de transición:

número de solicitud Hora de llegada Tiempo de carga Hora de finalización Servidores disponibles Servidor demandado Servidor asignado

0 1 7 8 0, 1 0 0

1 2 1 3 1 1 1

2 4 4 8 1 0 1

3 6 4 10 – 1 –

Enfoque: La idea es utilizar una Cola de Prioridad Mínima y un conjunto . La cola de prioridad lleva la cuenta de los servidores ocupados y ayuda a liberarlos tan pronto como estén libres. Set se utiliza para mantener los datos de los servidores disponibles para asignarlos a las requests entrantes. A continuación se muestran los pasos:

Inicialice una array auxiliar loadOnServer[] que almacenará la carga en cada servidor.
Repita las requests entrantes y encuentre la hora de finalización de cada solicitud agregando la hora de llegada y el tiempo de proceso en cada solicitud.
Extrae los servidores ocupados de la cola de prioridad cuya hora de finalización ha superado la hora de finalización actual.
Si el conjunto de servidores disponibles está vacío, descarte la solicitud actual.
Ahora, busque (i % m) ^el servidor en el conjunto utilizando la función de límite inferior y, si el iterador de límite inferior apunta al final del conjunto, elija el primer servidor del conjunto.
Aumente el contador de la carga en el servidor elegido después del paso anterior.
Después de los pasos anteriores, imprima todas las tiendas de carga en loadOnServer[] .

A continuación se muestra la implementación del enfoque anterior:

C++

// C++ Program for the above approach
#include <bits/stdc++.h>
using namespace std;
 
// Function to print load on each server
void printLoadOnEachServer(
    int m, int loadOnServer[])
{
    // Traverse the loadOnServer and
    // print each loads
    for (int i = 0; i < m; i++) {
 
        cout << i + 1 << "st Server -> "
             << loadOnServer[i] << ".\n";
    }
}
 
// Function for finding the load
// on each server
void loadBalancing(int n, int m,
                   int arrivalTime[],
                   int processTime[])
{
    // Stores the load on each Server
    int loadOnServer[m];
 
    for (int i = 0; i < m; i++) {
 
        // Initialize load on each
        // server as zero
        loadOnServer[i] = 0;
    }
 
    // Minimum priority queue for
    // storing busy servers according
    // to their release time
    priority_queue<pair<int, int>,
                   vector<pair<int, int> >,
                   greater<pair<int, int> > >
        busyServers;
 
    // Set to store available Servers
    set<int> availableServers;
 
    for (int i = 0; i < m; i++) {
 
        // Initially, all servers are free
        availableServers.insert(i);
    }
 
    // Iterating through the requests.
    for (int i = 0; i < n; i++) {
 
        // End time of current request
        // is the sum of arrival time
        // and process time
        int endTime = arrivalTime[i]
                      + processTime[i];
 
        // Releasing all the servers which
        // have become free by this time
        while (!busyServers.empty()
               && busyServers.top().first
                      <= arrivalTime[i]) {
 
            // Pop the server
            pair<int, int> releasedServer
                = busyServers.top();
            busyServers.pop();
 
            // Insert available server
            availableServers.insert(
                releasedServer.second);
        }
 
        // If there is no free server,
        // the request is dropped
        if ((int)availableServers.empty()) {
            continue;
        }
 
        int demandedServer = i % m;
 
        // Searching for demanded server
        auto itr
            = availableServers.lower_bound(
                demandedServer);
 
        if (itr == availableServers.end()) {
 
            // If demanded Server is not free
            // and no server is free after it,
            // then choose first free server
            itr = availableServers.begin();
        }
 
        int assignedServer = *itr;
 
        // Increasing load on assigned Server
        loadOnServer[assignedServer]++;
 
        // Removing assigned server from list
        // of assigned servers
        availableServers.erase(assignedServer);
 
        // Add assigned server in the list of
        // busy servers with its release time
        busyServers.push({ endTime,
                           assignedServer });
    }
 
    // Function to print load on each server
    printLoadOnEachServer(m, loadOnServer);
}
 
// Driver Code
int main()
{
    // Given arrivalTime and processTime
    int arrivalTime[] = { 1, 2, 4, 6 };
    int processTime[] = { 7, 1, 4, 4 };
 
    int N = sizeof(arrivalTime)
            / sizeof(int);
 
    int M = 2;
 
    // Function Call
    loadBalancing(N, M, arrivalTime,
                  processTime);
 
    return 0;
}

Producción:

1st Server -> 1.
2st Server -> 2.

Complejidad de tiempo: O(N*log M)
Espacio auxiliar: O(M)

Publicación traducida automáticamente

Artículo escrito por nexus18 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

C++

Deja una respuesta Cancelar la respuesta